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CHAPITRE PREMIER 


NOTIONS FONDAMENTALES 
DE LA THÉORIE DES PROBABILITÉS 


$ 1. Espace des événements élémentaires et probabilité 


\.- 1. Expériences à issues équiprobables. Nous allons commencer 
notre cours par la description de plusieurs expériences simples dont 
le résultat ne peut être prévu avec certitude et pour lesquelles on 
peut seulement parler de probabilité de telle ou telle issue. 

Lancement d'une pièce de monnaie. On fait appel à une expérience 
de ce genre lorsque l’on tire au sort: on jette en l’air une pièce de 
monnaie symétrique que l’on fait préalablement tourner énergique- 
ment, on voit alors apparaître « pile » ou 
« face ». 

Jeu de dé. L'expérience consiste à 
jeter le dé (un cube à faces marquées de 
1 à 6 points) et à observer le résultat. 
Le hasard peut amener a—1, 2, ..., ou 
6 points. 

Dans une expérience un peu plus 
compliquée liée à un jeu de hasard bien 
connu, les joueurs jettent à tour de rôle 
deux dés, le gagnant est celui qui obtient Fig. 1. 
le plus grand nombre de points au total. 

Dans ce jeu on voit apparaître d'une façon aléatoire l’une des combi- 
naisons (a, b) où a est le nombre de points amenés par le premier dé 
et b celui du second. 

Jeu de roulette. Imaginons un disque lourd horizontal en forme 
de cuvette porté par un axe sur lequel il est parfaitement équilibré, 
et que l’on fait tourner au moyen d'un moulinet horizontal. Les pa- 
rois sont divisées en { cases (fig. 1). Une bille lancée dans la roulette 
tournante. après avoir heurté divers obstacles, s’arrête dans une des 
cases et désigne ainsi le numéro gagnant..Le gain du joueur dépend 
du numéro v = 1, ..., À sorti et du jeu fait. 

À propos de chacune des expériences décrites ci-dessus on peut 
dire ceci: premièrement, le résultat de l’expérience est aléatoire : 
deuxièmement, le nombre de résultats s’excluant mutuellement 
est fini et, enfin, tous ces résultats sont équiprobables. 
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Nous dirons que les expériences de ce type sont des expériences 
à un nombre fini de résultats équiprobables, nous appellerons ces 
résultats événements élémentaires (simples) et nous les désignerons 
par ©. 

Soit NV le nombre total d'événements élémentaires réalisables par 
une expérience. Ceux-ci étant équiprobables, on peut considérer 
que la probabilité de chacun d'eux est égale à 1/N. 

Considérons un événement quelconque À pouvant se produire 
(ou ne pas se produire) suivant le résultat aléatoire ©, désignons par 
N (A) le nombre total de résultats élémentaires w conduisant à cet 

événement. Il est évident que l’évé- 
nement À est d'autant plus p r o- 
bable*) que le nombre { (4) 


Q” 
7 
, est grand. Nous allons supposer que 
1/4 &” Ja probabilité de l'événement 4, 
que nous désignerons par P (4), est 
proportionnelle à la grandeur NV (4), 
0 


plus exactement nous allons définir 

cette probabilité comme suit: 
P(4)=% 4%. (111) 
Par exemple la probabilité de 
face dans le jeu de pile ou face est 
Fig. 2. égale à !/,; la probabilité de voir 
apparaître un nombre pair de points 
dans le jeu de dé vaut également !/.; lorsque l’on jette deux dés, 
la probabilité de l'événement À correspondant à ce que la somme des 
points sortis est supérieure à 10 est égale à !/,., car le nombre de 
résultats élémentaires éventuels w, c’est-à-dire le nombre de diffé- 
rentes combinaisons de points (a, b), où a, b = 1, ..., 6, est égal 
à N = 36 et le nombre de résultats donnant lieu à l'événement À 
défini par le fait que a + b > 10 est N (A) = 3, l'événement À ne 
pouvant se produire que pour les combinaisons (5, 6), (6, 5), (6, 6). 

Revenons à l'expérience de la roulette. Après l'arrêt du disque 
la bille occupe une certaine position qui, supposant que la bille est 
un point sur la circonférence, peut être décrite par la coordonnée 
angulaire ©, 0 <'o < 27...., 

Le point aléatoire w peut se trouver dans un quelconque des NW 
secteurs égaux du disque avec la même probabilité 1/N. Supposant 
que la probabilité de trouver le point dans chacun des secteurs À — 
= [w’, w”] (fig. 2) est la même pour tous les secteurs de mème 


*) Une proposition intuitivement claire du type: «l'événement À est 
plus probable que l'événement B », doit d’après nous être comprise comme suit : 
lorsque l’on répète un grand nombre de fois l'expérience correspondante, l’événe- 
ment À se produira plus souvent que l'événement B. 
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angle au sommet w@” — w’, définissons cette probabilité P (4) 
comme suit : 


on _@w"—0’ 
: PA=S EE. 


Puis en développant la circonférence (de longueur L) sur le seg- 
ment [0, L] de la droite réelle —oo << x << oo, nous pouvons parler 
du point E = = L qui, suivant le cas, se trouve dans l’un des inter- 
valles [z’, x”] de ce segment, de plus 
la probabilité de le trouver dans chacun 
des intervalles de longueur zx” — x’ 
z"—7z 
L 

La grandeur Ë, coordonnée du point 
envisagé, dépend du hasard, autrement 
dit c’est une variable aléatoire. La pro- 
babilité pour qu'elle ait sa valeur dans 
[x', x”] peut être définie par la formule 


est la même et égale à 


x” 
P{r'<igr}= | pu(z)dz, (11.2) 


où la fonction p:(x) sous le signe 
somme, qui porte le nom de densité de 
probabilité, prend dans le cas considéré 
de la grandeur E les valeurs : 


( L pour 0Lr<LZ, 
pe (9) = 1 « _ 


O0 pour z<0, x>L. 0 F L x 
Fig. 3. Il est facile de voir que 
(4.1.5) pour la fonction y — œ (x) du 
Dans notre exemple la grandeur E est type mentionné le point aléa- 


uniformément distribuée sur le segment ‘t°iren — 9 (à) tombe avec une 
[0, Z] probabilité plus grande dans la 


° | moitié inférieure du segment 
Soit y = (zx) une fonction quel- [a, b], a = 0. 


conque sur le segment [0, L] à dérivée 
p" (x) positive et continue par morceaux; cette fonction est une 
application biunivoque du segment {0, L] sur un certain segment 
[a, b] (qui peut éventuellement être infini) (fig. 3). Considérons 
une nouvelle variable aléatoire n = œ (£). Trouver la probabilité 
pour que la valeur n se trouve dans l'intervalle {y < n < y”}. 
Désignons par z = 1 (y) la fonction sur le segment [a, b] inverse 
à y —œp(z), O<zr<L. Les événements {y <n<Ly’} et 
{p (y) SE L'Y (y”)} sont de toute évidence identiques, or la pro- 
babilité de l’événement {y (y) < E < vw (y”)} est d’après la formu- 
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d(77) 
le (1.1.2) égale à J Ps (x) dx. Avec le changement de variable 


z = QU on obtient que la probabilité cherchée de l'événement 
{y <n <y”} est 


V7) u” 
PYy<n<y}= | Ps (x) dx = Î Pa lb (y)] Ÿ° (y) dy — Î Pa (y) dy, 
y”) y 


où la fonction pA(y) est 


1 
Pa | POI RUT pour a<y<b, 41.4 


pour y<a, y>b, 
et dans notre exemple (auend re a=+, 0<z<L) 


Pn (y) = _ v ACTE mr’ 2<Y<b. 

On voit que la variable aléatoire n peut avoir une densité de probabi- 
lité pn(y), —00 << y << ©, assez compliquée. Connaissant p, (y) 
on peut déterminer comme suit la probabilité pour le point de se 
trouver dans l'intervalle [y’, y”]: 


P{y&n<v}= | pa(u) dy (Pn (y) >0, [pu dy 1). 


Soient maintenant deux variables aléatoires Ë, et E, analogues 
à la variable aléatoire £ envisagée ci-dessus et indépendantes l’une 
de l’autre. Supposons que le point E, soit distribué de manière 
aléatoire sur le segment [0, L.] de l'axe —o << x, << et le point E, 
sur le segment [0, Z,] de l'axe —co << x, << © d’un système de 
coordonnées cartésiennes dans le plan. 

Considérant (£,, E.) comme un point aléatoire de coordonnées Ë; 
et £, dans le plan, nous pouvons trouver la probabilité pour ce point 
de se trouver dans tel ou tel domaine À (à limite continue par 
morceaux) d’une manière analogue à la formule (1.1.2): 


P (4) =- | | Perte (Zi, Te) di dre, (4.1.5) 
A 


OÙ D:ite (T1, Ze) prend les valeurs : 


[ our 0OLrziL Li, OLTeL La, 
par, m)=i ile ? SSD SES 4.1.6) 
[oO pour les autres xi, Ze. 


Pour le domaine À pris dans le rectangle Q ={0 < x, < L;, 
0 & x:  L:} contenant par définition le point (E,, 2), la probabi- 


$ 1] ESPACE DES £VENEMENTS ELEMENTAIRES ET PROBABILITÉ 11 


lité P (4) donnée par (1.1.5) pour le point de se trouver dans À est 
égale au rapport de l'aire du domaine À à celle de tout le rectangle (2. 


Exemple. Considérons deux points distribués de manière 
aléatoire et indépendamment l’un de l'autre sur des segments de 
longueur Z. Trouver la probabilité pour que la distance les séparant 
soit non supérieure à L. 

Désignons par E,, &, les coor- 72 
données de ces points sur le seg- £ 
ment [0, Z]. Portons £, sur le 
segment [0, L] de l’axe x, et E, 
sur le segment [0, L] de l’axe x. 
et supposons que les points (E:, 

E.) sont jetés au hasard sur le 
carré Q ={0<zr <L, 0< & 
Lt: L L}. Il est évident que la 
probabilité cherchée pour que 

A = ]|E — 6, | ? coïncide avec 

la probabilité P (4) pour le point 
(£,, £+) de tomber dans le do- 
maine À limité par les droites Fig. 4. 

Ze = l+x et Te = —l+7x, 

(région non hachurée sur la figure 4). Ainsi en vertu de la formule 
(1.1.5) la probabilité P (4) peut être définie comme suit : 


P(4)= (Trans, 
A 


où 2LI — Ë est l’aire du domaine À. 


Exemple (problème de l'aiguille de Buffon). Supposons que 
sur un plan couvert de lignes parallèles menées à une distance L 
l’une de l’autre on jette au hasard une aiguille, 


er c'est-à-dire un segment de longueur !, l < L. 
- Trouver la probabilité pour ce segment de 
L_ Az ___ couper une des lignes. 

L VE Désignons par £, l’angle que forme le seg- 


ment avec la direction des lignes et par E. la 

distance de son extrémité inférieure à la droite 

Fig. 5 supérieure la plus proche (fig. 5). En vertu des 
conditions de l'expérience la variable aléatoire 

E, est uniformément répartie sur le segment 

[0, xl, et E, sur le segment [0, Z]. Il est intuitivement clair que 
les grandeurs Ë, et E, sont indépendantes l’une de l’autre ; nous allons : 
supposer que le point (£,, £.) se trouve dans un domaine quelconque À 
du plan avec la même probabilité que si ce point (£,, E-) était jeté 
au hasard sur le rectangle Q ={0< 7, < 7, 0 < x,  L}. Il est 
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évident que le segment de longueur ! coupe l’une des lignes dans le 
cas et seulement dans le cas où l’on a 


E9 & L sin E;, 


c'est-à-dire lorsque le point (E,, £.) tombe dans le domaine À limité 
d’en haut par la courbe :, = ! sin z, (fig. 6). En vertu de la formu- 


le (1.1.5), la probabilité pour le point 
ll 


T2 (&1 82) de se trouver dans ce domaine est 
Pass \ % 


P(4)= (ddr = 7. 
A 


Soit un couple quelconque de varia- 
bles aléatoires £, et £. pour lesquelles la 
probabilité de trouver le point (E,, &.) 

Fig. 6. dans un domaine À est donnée par la 
formule (1.1.5), où p:,:, (z1, to), —o0 x, 
< co, est une fonction non négative satisfaisant à la condition 


É | Pit, (fi, Ze) A2, dx, = 1. Nous appellerons cette fonction 
densité de probabilité des variables aléatoires £,, E.. 

Considérons les fonctions n1 — @1 (E1, Ëe) et na = wo (Er, Ëo) 
des variables aléatoires £,, E, initiales. Soit 


Yi = Pi (us Los Ye = Pe (Zn Le) 


une transformation biunivoque du plan avec le jacobien 


0p1 ds 
I OTy  OZo 
LITE og 292 
UE ÜTo 


non nul et soit 
Ty = Ya (Ya Yo), Te = Vo (Yr1r Yo) 


la transformation inverse. 

Dans la transformation envisagée le domaine à limite continue 
par morceaux devient un domaine du mème type. Pour un domaine B 
quelconque le fait de contenir le point (1n,, n2) signifie que le point 
correspondant (E,, £.) est tombé dans le domaine À dont l’image 
par Yi = Pi (Air Te), Ye — Pr (1, Ze) est B, c'est-à-dire que les 
événements {(n:, n2) € B} et “{(E, Ë2) € A} coïncident. Par consé- 
quent, en vertu de la formule (1.1.5) la probabilité P (B) pour le 
‘point (n:, 2) de tomber dans le domaine B est 


P(8)= | | Pise Gr Te) dr dx:, 


A 
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d’où après le changement de variables z, — 41 (y, Ye), Ze = 
= Ÿ+ (Y1, Ye) on obtient une formule analogue à (1.1.5): 


P (B)— | | Pnyne (Yi Ye) dyi dye, 
B 


Pains (Vas Ye) = Pet, (1 (Vas Ye), Ve (Vas Ye)I | I [TT (1.1.7) 


est par la définition ci-dessus la densité de probabilité des variables 
M1» UET donc 
Pnyne (Yi: y:)>0, | | Pnyne (1 Ye) dy dy: = 1. 


—œ0 —@ 


2. Espace des événements élémentaires. Lorsque i’on envisage 
un couple de variables aléatoires E,, &. de densité de probabilité 
Paz, (Tu Te), On peut considérer qu'on a affaire à une expérience 
où l’on observe le point aléatoire (E,, Ë.). Les résultats élémentaires 
d’une telle expérience apparaissant en ce que les variables aléatoires 
61, &2 prennent des valeurs données z,, x, peuvent être décrits par des 
points correspondants (z,, x.) dans le plan et tous les événements du 
type {(Ë1, Ëe) € A} (le point aléatoire (E,, £.) tombe dans le domaine 
A) sont en fait décrits par les ensembles correspondants À. Sans 
entrer dans le détail de l’expérience, on peut décrire le mécanisme 
du hasard y agissant, en déterminant la probabilité P (4) des diffé- 
rents événements À (voir la formule (1.1.5)). 

Dans cet exemple on voit apparaître clairement tous les traits 
essentiels du modèle probabiliste général qui représente une « expé- 
rience », comprise au sens large du mot, à résultats aléatoires. Lors- 
que l’on décrit un tel modèle, on indique tous les résultats élémen- 
taires possibles w, satisfaisant à la condition suivante : l'expérience 
réalise un et un seul de ces résultats (qui sont appelés également 
événements élémentaires, et tout l’ensemble est dit espace des événe- 
ments élémentaires). De plus on donne une description du « mécanis- 
me de hasard » agissant dans cette expérience, à savoir les probabi- 
lités P (4), 

0<P(4)<1, (1.1.8) 


des événements À ; la probabilité d'un événement certain est supposée 
égale à 1, la probabilité d’un événement impossible est égale à 0 
(ci-dessous on étudiera plus en détail la manière dont il y a lieu de 
se donner les probabilités). 

Ce qui nous intéresse dans tout événement À pris isolément 
c'est de savoir si l'expérience donnée le réalise ou non; de ce point 
de vue on peut ne pas différencier les événements À, et 4, pour 
lesquels l'apparition de À, entraîne également la réalisation de À, 
et inversement. 
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Considérant l'événement À lié à l’expérience (2 *) on peut, com- 
me nous l’avons déjà fait dans les exemples décrits ci-dessus, séparer 
l’ensemble de tous les résultats élémentaires © € S donnant lieu 
à l'apparition de l’événement À ; nous désignerons cet ensemble par 
le même symbole À que l'événement étudié. Il est clair que la réali- 
sation de l’événement {w € À} consistant en ce que le résultat © 
de notre expérience fait partie de l’ensemble À = Q envisagé signi- 
fie exactement la réalisation de l'événement À. 

En effet, si une expérience donnée réalise l'événement À, on 
observe un certain résultat w donnant lieu à l'apparition de cet 
événement, or tous ces résultats forment l’ensemble À & Q de telle 
sorte que © € À ; d’un autre côté, si l'événement {w € À } a eu lieu, 
c’est-à-dire si l’un des résultats élémentaires © € À s’est trouvé 
réalisé, par définition de l’ensemble À = Q ceci signifie que le résul- 
tat © de notre expérience conduit à l'événement À. 

Ainsi les événements À et {wo € À } coïncident en fait, et par là 
même tout événement lié à l'expérience envisagée @ peut être décrit 
par l’ensemble correspondant À des résultats élémentaires « € Q 
donnant lieu chacun à la réalisation de cet événement. On peut 
conventionnellement identifier l'événement À avec l’ensemble cor- 
respondant À = Q. (Notons une fois de plus que À, en tant qu’en- 
semble quelconque de résultats élémentaires « de l'expérience étudiée 
(2 désigne un événement réalisé si et seulement si on observe l’un des 
résultats élémentaires «© faisant partie de l’ensemble mentionné 
À & (.) Un événement certain À, réalisable quel que soit le résultat 
élémentaire w € , peut être identifié à tout l’espace des événements 
élémentaires Q; il est commode d'introduire également un événe- 
ment impossible que l’on identifie à un ensemble vide G. 

Cette méthode de la théorie des ensembles permet de définir d'une 
manière figurative les différentes opérations sur les événements. 
On appelle réunion ou somme des événements À, et À, l'événement 
A; U À, qui est réalisé si l’un au moins des événements 4, et 4, 
l’est (l’événement À, || À, en tant qu'’ensemble des résultats élé- 
mentaires œ € (2 est la réunion des ensembles correspondants 4,, 
A); on définit d’une manière analogue la somme U 4, des événe- 


k 
ments A,, 4:, . .. On appelle intersection ou produit des événements 
A, et À, l'événement À, f] À, (noté encore 4,-4.) qui est réalisé 
si et seulement si les deux événements À, et A, sont réalisés (en tant 
qu'ensemble dans l’espace des événements élémentaires © l’événe- 
ment À, f\ À, est l'intersection des ensembles correspondants 4,, 
A; © Q); d'une manière analogue on peut définir l'intersection 
N À, d’un grand nombre d'événements 4,, 4:, ... On appelle 
k 


*) C'est-à-dire un événement apparaissant (ou non) si l’on observe le résul- 
tat aléatoire « € Q. 
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événement complémentaire de À l'événement À tel que si À est réalisé, 
A ne l’est pas (A est le complémentaire de l’ensemble À dans l’espa- 
ce des événements élémentaires (2). On appelle différence des évé- 
nements À, et À, et on note 4, 4, l'événement pour lequel À, est 
réalisé alors que À, ne l’est pas (4, KA, est la différence des ensembles 
A, A2 © Q). Ensuite, les événements 4, et 4. sont appelés incom- 
patibles ou disjoints s'ils s'excluent mutuellement : si À, est réalisé, 
A, ne l’est pas et inversement (4, et À, en tant qu’ensembles dans 
l’espace S ne s’intersectent pas). 

On peut également exprimer dans le langage de la théorie des 
ensembles d’autres relations entre les événements; par exemple, 


<< 
_© 

Lo 
7 


a 


NZ 


Fig. 7. a — A, et A4: sont des événements incompatibles (disjoints); b — la 
zone blanche est la réunion 4, |} 4.: c — la zone blanche représente l’inter- 
section A1 f) A2; d — la zone blanche est la différence A, A2; e — l’événe- 
ment 4. est le complémentaire de 4, ; f — l'événement 4: est contenu dans 41. 


au lieu de dire que « l'événement À, entraîne l'événement 4, » on 
peut dire que « 4, entre dans l'événement À, », ces deux expressions 
signifiant que si un résultat élémentaire quelconque w € Q conduit 
à l'événement À, (w € À,), l'événement À, (c'est-à-dire «w € 4:) 
apparaît également. Dans la terminologie de la théorie des ensembles 
ceci signifie que l’ensemble 4, fait partie de l’ensemble 4, : 4, = 4,. 

Certaines des relations mentionnées ci-dessus entre les événe- 
ments sont représentées d'une manière conventionnelle sur la figu- 
re 7 où les événements élémentaires w sont des points du carré Q. 

Considérons en guise d’exemple l'expérience dans laquelle on 
jette deux dés. L'événement À « le nombre total de points est pair » 
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est la réunion des événements disjoints: À,, « chaque dé présente 
un nombre de points pair » et À,, « chaque dé présente un nombre de 
points impair» ;on a alors À, = A A,et A: = AA, ; l'événement À 
a pour complémentaire l'événement À consistant en ce que le nombre 


total de points sortis est impair; le complémentaire de À, est 4: 
« l’un au moins des dés donne le nombre impair de points » et le com- 


plémentaire de 4, est A,: « l’un au moins des dés amène le nombre 
pair»,onaalors A, X A = 4,f 4 = A,et A: À = A4, À = À.. 

Il est facile de voir .que les relations existant entre les différents 
événements obéissent à la loi générale suivante. Si 4, = 4,, on 
a A,= A; si À = A, U 42, ona À = À, fN 4:; si À = 4, 42, 
on a À — À, U 4. En général, lorsque se trouve vérifiée une rela- 
tion exprimée par des signes d’égalité =, d'inclusion = (ou =), 
de réunion |} et d’intersection [}, sera également vérifiée une rela- 
tion obtenue à partir de la relation initiale en remplaçant les signes 
d'inclusion (= et =) par les signes inverses (= et =), la réunion || 
par l'intersection f] et inversement l'intersection (| par la réunion |) 
et en remplaçant simultanément les événements correspondants par 
les événements complémentaires. Par exemple, les relations suivantes 
sont équivalentes 


A = AÙ (4, N A2), = AU (4 N A2), 
A = A,f (4:fN 42), À = AN (41 U 42) 


(notons qu'ici À coïncide avec la différence des événements À,, À:, 
c'est-à-dire À = A,/X 43). 


3. Propriétés fondamentales de la probabilité. Additivité et 
continuité. Considérons des événements disjoints À, et A, réali- 
sables avec les probabilités P (4,) et P (4.). Trouver la probabilité 
de l'événement À, |} À, qui est leur réunion. 

Si les événements étudiés proviennent d'une expérience ayant 
un nombre fini de résultats élémentaires-équiprobables, la probabili- 
té cherchée sera d’après la formule générale (1.1.1) 


P (41 U 42) = P (4) + P (42), (1.1.9) 


car l'événement 4, |[J 4, est la réunion de tous les résultats élémen- 
taires entrant dans À, ou 4., de telle sorte que leur nombre total 
est N (A, | À:) = N (4;) + N (42) et 
N (A4 U As) __N LED + À Ga) N ee. 
N 


On arrive à la même égalité 419 en considérant des événements 
du type {(E:, £2) € A} liés à l'observation de certaines variables 
aléatoires E, et E., lorsque tout événement de ce type est décrit par 
l’ensemble correspondant À dans le plan et les événements disjoints 
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A,, À, sont alors dans ce sens des ensembles disjoints. En vertu de la 
formule (1.1.5) on a 


P (4iU 42) = 1 Peso (Xi, Te) di dre — 


AtUA2 


= (Tous (eu 22) des dre + [| pass (rs, 22) dus dre = P (41)+ P (4e). 
A1 A2 


Dans le modèle général probabiliste la relation (1.1.9) pour des 
événements disjoints À, et À, est un axiome; c’est l’axiome des 
probabilités totales. 

La propriété d'additivité des probabilités qui y est exprimée est 
analogue aux propriétés de la longueur, de la surface, du volume, 
etc. Ainsi, en vertu de cette propriété, l'événement complémentaire 
A d’un événement quelconque À de probabilité P (4) a pour proba- 
bilité h 

P (4) = 1 — P (4) 
(la probabilité d’un événement certain À (J À est égale à 1); 
P (4:) < P (42) pour 4, = 4; ; 
P (4 U 42) = P (41) + P (42) — P (4: N 42) 


pour des événements quelconques À, et 4., etc. 
Naturellement l’axiome des probabilités totales peut se généra- 
liser à un nombre quelconque d'événements disjoints À,, A, . .. 
.. À, en appliquant successivement la formule Œ&. 1.9) à des 


couples d'événements disjoints À, et Ç Ù A»), A2 et ( Ü 4x), . 


.… An et À, on obtient finalement 
2 a 
P(U 4:)= 2 P (4). 41.10) 
k=1 k=1 
Soit maintenant une suite infinie d'événements impliquant cha- 
cun tous les précédents : 
A2 4: 2...2 An = A, =... 


Trouver la probabilité de réalisation de tous les événements 4À,, 


” Par définition, tous les événements A1, A», .-.-., À, sont réalisés 
si l'événement À, l’est, alors a Ar = Aet P (i 43) = P (4,). 
k=— 


hk= 
Comme P (4,+:) < P (4,) quand An+1 © An; la suite de probabi- 
lités monotone décroissante P (4,), nr = 1, 2,..., a une limite 


? U 


lim P(4,). Dans la théorie générale des probabilités on suppose 


7 — 0 


2—09521 


48 NOTIONS FONDAMENTALES DE LA THÉORIE DES PROBABILITÉS [CH. I 


que cette limite coïncide avec la probabilité de réalisation de tous 
les événements À4,, À4,, ..., c’est-à-dire avec la probabilité de 


l'événement À = f\ À, 
k—1 
P(4)= lim P (4h): (1.1.11) 


n— 0 


cette relation exprime la continuité de la probabilité. 

Nous allons montrer que l’additivité et la continuité, exprimées 
par les relations (1.1.10) et (1.1.11) respectivement, dans leur en- 
semble sont équivalentes à l’additivité dénombrable, c'est-à-dire que 
pour un nombre quelconque (fini ou dénombrable) d'événements 
disjoints À,, 4, ...ona 


P (UAy= à P (44). (1.1.12) 


En effet, pour des événements quelconques disjoints À,, A4. ... 
A, ._. les événements B, — A;, B, — A; U À, . B, = 


n 
— (J À, forment une suite croissante monotone, en ce sens que 


B,=B,=...=B, <=... et les événements complémentaires 
B,, B:, ..., Bh, ... sont tels que P, = B, D ...=2B, =... 
L'événement À — U A, coïncide de plus avec l'événement U Br 
et l'événement complémentaire À avec l'événement f} B4. En vertu 
R 
de la propriété de continuité (1.1.11) on a P (4) = lim P(B,). 
ni — 00 


Mais P (A) =41-—P(4), P(B,) =1—P(2,), alors d'après la 
propriété d’additivité (1.1.10) on a P(B,) = >) P (44), 
h=1 


== 


= 1, 2, ... Par conséquent 
P(4)=1—P(4)=limf{—P(8,)] = 


—]limP (Br)=lim 2 à  P (A1) = À P (A), 


R=1 
n— 00 k=! 


c'est-à-dire que l’on a l'égalité (1.1.12). 

D'un autre côté, si À, = 4, = ... est une suite quelconque 
d'événements décroissante monotone (la réalisation de À, entraîne 
celle de À,,..., An), alors les événements complémentaires 


A1, À, . . . forment une suite croissante monotone À, = 4, = 
et leur réunion A = U À, peut être représentée comme une réu- 
k 


nion d'événements disjoints B, = A, B, = A,\X A1, ….., Bn = 
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= A, An -.…, donc À = U B:. Selon la formule (1.1.12) 
R 


P(A)= 2 P(B)= 2 {P (4:)—P (4x)1= lim P (45) 


et par conséquent la relation (1.1.11) se trouve vérifiée 


Exemple (jeu jusqu'à la première perte). Soit le jeu de pile 
ou face où gagne celui qui a deviné le résultat du jet d’une pièce de 
monnaie équilibrée (les deux résultats: pile ou face, étant équipro- 
bables). Supposons que l’on continue le jeu jusqu'à la première perte. 
Les résultats élémentaires sont appelés parties en n coups. On peut 
les décrire par une suite de la forme ffp . . . pfp, où p signifie pile 
et f, face. Nous allons considérer tous les résultats élémentaires possi- 
bles comme équiprobables. Leur nombre total étant M — 2", la 
probabilité de chacun des résultats est égale à 2". 

Quelle que soit la stratégie du joueur (par exemple, s’il parie 
toujours face), le jeu jusqu'à la première perte (jusqu’à la première 
présentation de pile) admet un nombre infini d'’issues : la perte peut 
apparaître dès le premier coup, lors du second, etc. Chaque issue 
élémentaire est donnée par un nombre » de coups jusqu’à la première 
perte : z = 1, 2, ..., en remarquant que la probabilité pour que ce 
nombre soit justement x est de toute évidence égale à 2”. Ainsi, 
à titre de modele probabiliste on peut prendre l’espace des événe- 
ments élémentaires coïincidant avec l’ensemble de tous les nombres 
naturels nr — 1, 2, ..., en attribuant à l'issue élémentaire x ja 
probabilité 2". Comme dans toute autre expérience, la probabilité 
d'un événement certain (réunissant toutes les issues élémentaires) 


doit être égale à 4, ce qui est en accord parfait avec formule générale 
(1.1.12) : 


Pour achever l'interprétation donnée, on aurait pu admettre l’issue 
n —= ©, signifiant que, dans une suite infinie de jets d’une pièce 
de monnaie, pile n’apparaîtra.jamais ; dans le cadre de notre modèle 
la probabilité de cette issue est égale à zéro. 

Calculons la probabilité pour que le nombre de jets d’une pièce 


de monnaie avant l’apparition de pile soit pair. En appliquant la 
formule (1.1.12) on obtient 
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(et non !/, comme on aurait pu le penser par erreur, vu l’équiprobabi- 
lité de pile et face; notons que la probabilité d'obtenir pile lors 
du premier coup est égale à !/,, mais elle peut apparaître également 
lors du troisième, cinquième, etc. coup). 


Ainsi, le modèle théorique général représente l’espace Q des 
issues élémentaires w, où, pour les événements considérés À & Q, 
sont données les probabilités P (A), satisfaisant à la condition d’ad- 
ditivité dénombrable (1.1.12). 

Le problème fondamental, apparaissant sous une forme ou l’autre 
dans la majorité des problèmes de la théorie des probabilités, se pose 
comme suit: étant donné les probabilités P (4) de certains événe- 
ments simples À, dont l’ensemble sera désigné par y, trouver les 
probabilités P (B) d’autres événements B liés en quelque sorte aux 
événements À € y (plus exactement obtenus à partir des événements 
initiaux À € y par opérations successives de réunion, d’intersection, 
de passage à des événements complémentaires, etc.). 

Certes, dans chaque cas particulier ce problème se résout d’une 
maniere différente, mais une question qui est commune à tous ces 
problèmes est de savoir si les probabilités P (B) peuvent, oui ou non, 
en principe, être trouvées à partir des probabilités P (4), À € y. 
Cette question, très importante pour la théorie des probabilités, a une 
réponse positive quand le système initial d'événements y qui, en 
même temps que les événements À,, 4,, contient leur intersection 
A; f 42, et pour des événements quelconques À, À, € y tels que 
A, € À, la différence À X A, peut être développée en une somme 
finie d'événements disjoints 4,, . .., À, de y (on dit parfois qu’un 
tel système y est décomposable). Lorsque le système y est décompo- 
sable, on a la formule suivante *): 


P(B)= inf SP (4), (1.1.13) 
ADB À 


où l’infimum est pris sur tous les événements 4,4, k = 1, 2, ... 
de y dont la somme donne l'événement À = U À, contenant B. 


k 
On peut citer à titre d'exemple d'un système décompesable d'événe- 
ments, dans une expérience où l’on observe une certaine variable 
aléatoire E, l’ensemble des événements du type À ={z <E < xr”} 
qui se lit comme suit: « le point E tombe dans le segment (zx, x”] 
ouvert à gauche »; dans une expérience où l’on observe un couple de 
variables aléatoires E,, Ë., un système décomposable est celui de 
l'ensemble de tous les événements du type À ={r << E, < 7°, 
x, < E, L ri}: «le point de coordonnées (E,, E:) tombe dans le 


*) Voir, par exemple, Guikhman I., Skorokhod A., Zntroduction à La théorie 
des processus aléatoires (en russe), Moscou, Nauka, 1965, D. p. 121 et les suivantes. 
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rectangle (x;, xl X (x:, xl privé des côtés formant l'angle inté- 
rieur gauche. 

Dans la suite, en étudiant tel ou tel modèle probabiliste, nous 
allons supposer que les probabilités des événements qui nous inté- 
ressent sont en principe déterminées et qu’il y a lieu de les trouver. 


4. Conformité du modèle et de l’expérience. Dans les applica- 
tions, lorsque l’on utilise tel ou tel modèle probabiliste, il est toujours 
intéressant de savoir à quel point ce modèle correspond à ce qui se 
passe en réalité, à l’expérience réelle. 


Exemple (probabilité de naissance d'un garçon). On a tout 
lieu de penser que la naissance d’un garçon ou celle d’une fille sont 
dans chaque cas particulier des événements équiprobables (c’est-à- 
dire que la naissance d’un enfant, du point de vue probabiliste, est 
analogue à l’expérience du jet d’une pièce de monnaie: un garçon 
ou une fille naissent avec une même probabilité égale à !/.. 

Nous allons envisager chaque naissance comme une expérience 
dans laquelle avec une probabilité p naît un garçon et avec une 
probabilité 1 — p naît une fille, de plus nous allons supposer que le 
résultat d’une expérience n'influe en aucune sorte sur le résultat de 
l’autre (autrement dit, nous allons supposer que les naissances sont 
des expériences indépendantes). 

Dans n « expériences » de ce type le nombre m de garçons nés est 
aléatoire. La probabilité pour que la fréquence m/n de naissance d’un 
garçon s'écarte de p = !/, d’une certaine grandeur Ô >> 0 est (voir 
plus loin le $ 3 du chapitre IT) 


P{E—-p>65}&1-—0(25Vn), 


où © (x) — VE il e-"*/2 du, et dans l’'approximation adoptée 
l'erreur ne dépasse pas 1/V r. On prend 6 de telle sorte que 1 — 
— ED (26 V nr) < &. où & est un nombre aussi petit qu’on peut négli- 
ger la possibilité d'apparition d’un événement ayant une probabilité 
égale ou inférieure à €. Par exemple, si € — 0,002, la table de la 
fonction (zx) (voir page 95) donne x = 26Vnr > 3 

Depuis très longtemps presque dans tous les pays on enregistre 
les naissances, donc on a accumulé un grand nombre de données 
statistiques. Par exemple, en Suisse, de 1871 à 1900 on a enregistré 
la naissance de 1 359 671 garçons et de 1 285 086 filles *). Confor- 
mément à ces données, pour n = 2 644 757 on avait m — 1 359 671 
et m/n = 0,5141. Est-ce que ce chiffre se trouve en accord avec le 


. n B. L. Van der Waerden, Mathematische statistik, Springer-Verlag, Ber- 
in, 1957. 
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modèle choisi dans lequel p = !/, ou bien, en réalité, la probabilité 
de naissance d’un garçon est supérieure à {/e ? 
Pour p =!/.on a 


m 4 ed 
nor OURS EE : 


donc, dans le cadre du modèle que nous avons adopté, nous « obser- 
> + . . . m 1 
vons» un événement pratiquement impossible {= — 7 > 6}. 


plus exactement, la probabilité de cet événement n’est pas supérieure 
à 0,002. Mais si, en réalité, la probabilité de naissance d’un garçon 
est supérieure à !/, (par exemple, p — 0,51), cet événêment n’a rien 


d'étonnant {= — - > 6} : comme le montre le calcul, sa probabi- 


lité est voisine de 1. En se basant sur ces données il y a lieu de rejeter 
l'hypothèse suivant laquelle p = !/, et d'adopter p > !/; (en un 
certain sens, la meilleure estimation de la probabilité de naissance 


. » . se e m 
d'un garçon suivant les données statistiques est la fréquence = 


= 0,5141). 

Dans le présent ouvrage nous examinerons différents modèles 
probabilistes, sans poser la question de savoir à quel point ils con- 
cordent avec les événements réels correspondants (de tels problèmes 
font l’objet d’une science spéciale, appelée la statistique mathéma- 
tique). 


$ 2. Indépendance et probabilité conditionnelle 


1. Notion d'indépendance. Considérons deux expériences indé- 
pendantes Q, et (, ayant chacune un nombre fini d’issues équipro- 
bables. On entend ici l'indépendance en ce sens qu'aucune des issues 
élémentaires w, de la première expérience n’a d'influence sur l'issue 
w. de la seconde expérience (et inversement). A titre d'exemple on 
peut citer (voir le début du $ 1) deux lancements d’une pièce de mon- 
naie (w, est ici l’issue du premier coup, w, celle du second) ; le lance- 
ment d’une pièce de monnaie (, et celui d’un dé Q,, etc. 

Considérons les événements À,, 4, liés l’un à l'expérience Q, 
et l’autre à l'expérience Q.. Trouver la probabilité de l'événement 
A = À;-A, provenant de l'expérience qui est un ensemble d’expé- 
riences indépendantes Q,, (2.. 

L’issue élémentaire des expériences envisagées peut être décrite 
par le couple (w,, w.), où w, est l'issue élémentaire de la première 
expérience et w., de la seconde. Il est intuitivement clair que pour 
des issues équiprobables et indépendantes w, € (9, et w, € Q, les 
issues élémentaires © — (w,, w.) doivent également être eéquipro- 
bables. Si le nombre total d’issues de la première expérience est W;, 
et de la seconde, W,, le nombre de taus les couples possibles © — 


$ 2] INDÉPENDANCE ET PROBABILITÉ CONDITIONNELLE 23 


= (w,, w.) sera évidemment égal au produit W, -W.. Ainsi, le nombre 
total d'issues élémentaires © = (w,, w.) est N = N,-N,. L'’événe- 
ment 4 = À4,-4, signifie que les deux événements À, et 4, sont 
réalisés, ce qui aura lieu si et seulement si le sont les issues élémen- 
taires o1 € À, et w2€ A+ On a donc NW (4) = N, (4,)-N3 (4:) 
issues élémentaires © — (w,, w.) donnant lieu à l'apparition de 
l'événement À = 4,-4, (ici V, (4,), V3 (42) sont les nombres 
d'issues élémentaires w, et w. donnant lieu respectivement à l’évé- 
nement À, dans la première et à l'événement 4, dans la seconde expé- 
rience). En vertu de la formule générale (1.1.1), la probabilité de 
l'événement À = À,-4, se définit comme suit: 

N (4) __ Ni(4i)-Vo (49) 
P(A)=- Ny No 


et peut directement être exprimée en fonction des probabilités 
P (4,), P (42) des événements indépendants À4,, À,, à savoir 


P (4) = P (4i) P (4). (1.2.1) 


Ainsi, pour les événements du type À = 4, -A, où les événements 
isolés 4, et 4, sont liés à des expériences indépendantes, la probabi- 
lité P (4) est donnée par la formule (1.2.1). 

Il est vrai que jusqu’à présent nous n'avons envisagé que des 
expériences indépendantes ayant un nombre fini d’issues équipro- 
‘ bables. 


Considérons maintenant les expériences indépendantes Q, et Q, 
dans lesquelles on observe respectivement les variables aléatoires E, 
et £. mutuellement indépendantes. 

Soit p, (x) la densité de probabilité de la variable aléatoire E,; 
la probabilité de tout événement du type 4, ={z, < 6, < z;}: 
« le point aléatoire £, tombe dans l'intervalle [zx°, x°] », est donnée 
par la formule (1.1.2): 


P(4)= | pi(o)de. 


A! 


Imaginons que le segment [a, b] des valeurs possibles de la variable 
aléatoire £, (ce segment peut également être infini) soit divisé en NW, 
parties de telle sorte que le point puisse tomber dans chacun des 
intervalles A, = (zx, zr41l, k = 1, 2, ..., N, avec une même 
probabilité : 


P{nE<an= | pod 7. 


&k 


En choisissant N, suffisamment grand, on peut avec la précision 
voulue trouver la probabilité de l’événement À, (probabilité pour 
7 
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le point aléatoire E, de tomber dans l'intervalle [x’, x°]) à l’aide de la 


formule suivante : 
(4) & > je (x) dx — HE , 


où la sommation s'effectue sur les Æ pour lesquels A, = {x;, x], 
N, (4,) étant le nombre d’intervalles contenu dans le segment envi- 
sagé [zx;, x]. Ceci signifie en fait qu'avec une précision aussi bonne 
que l’on veut on peut trouver les probabilités des différents événe- 
ments, liés à l'expérience Q,, en la considérant conventionnellement 
comme une expérience à un nombre fini d'’issues élémentaires, con- 
sistant chacune dans le fait que la variable aléatoire £, tombe dans 
l'intervalle correspondant A,, k = 1, ..., N.. 

On peut appliquer ce raisonnement à l'expérience Q, où l’on 
observe la variable aléatoire £, avec une densité de probabilité 
P2 (x) et où l’on envisage l'événement 4, ={x, < E, < x5}. En 
utilisant la formule (1.2.1) pour les expériences à un nombre fini 
d’issues équiprobables pour , et V, suffisamment grands (désignant 
le nombre d’intervalles de partition dans chacune des expériences), 
avec une précision aussi grande que l’on veut on a pour l'événement 
A = À,-A, 


PA) EP (A))-P (42). 


Ceci signifie qu’en réalité on doit avoir l'égalité exacte 
P (4) = P (4,)-P (42), 


c'est-à-dire que l’on retrouve la formule (1.2.1) obtenue précédem- 
ment pour des expériences indépendantes à un nombre fini d’issues 
équi probables. 


Considérons enfin des événements À, et 4, provenant des expé- 
riences indépendantes quelconques Q, et Q.. Tout comme précédem- 
ment on comprend l'indépendance en ce sens que pour des conditions 
physiques concrètes d'expériences aucune issue de la première n'a 
d'influence sur l'issue de la seconde (et inversement). 

Il est clair que la probabilité de l'événement À = 4,-4, dans 
les expériences indépendantes envisagées Q,, Q., doit être la même 
que dans toutes autres expériences indépendantes Q°,Q, donnant lieu 
à un événement À’ = À;-4;,, où les événements 4, = Q,; et 4, = 
= Q, ont la même probabilité que les événements initiaux 4, = 
= Q, et A, = Q.. Mais pour des probabilités quelconques Pi = 
= =P (A,) et p. = P (42) on peut effectuer des expériences indépen- 
dantes Q et (, du type décrit ci-dessus (dans lesquelles on observe 
des variables aléatoires £, et E, de densité de probabilité p, (x) et 
P2 (x)), en choisissant les événements correspondants À; et 4, avec 
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les mêmes probabilités p, = P (4;) et p: = P (4). Nous avons déjà 
montré ci-dessus que l’on doit avoir la relation P (4°-4:) = pP; -P: 
et par conséquent P (4, -4:) = p, -Do. 

Ainsi la formule (1.2.1) doit être vraie pour des événements 
quelconques À,, À, liés aux expériences indépendantes Q,. Q.. 


En théorie des probabilités, tout comme dans toute autre disci- 
pline mathématique, les notions de base sont décrites dans les ther- 
mes du modèle théorique correspondant. Le modèle général de la 
théorie des probabilités peut être représenté comme un espace Q 
des issues élémentaires w dans lequel à une certaine classe d’ensem- 
bles À = Q, appelés événements, on associe des probabilités P (4) 
satisfaisant à l’axiome des probabilités totales (formule (1.1.12)). 
Dans cette abstraction il ne saurait être question de « conditions 
physiques concrètes » dont l’analyse permettrait de juger de l'inde- 
pendance de tels ou tels événements À,, 4, = Q. 

Dans le cadre du modèle général de la théorie des probabilités, 
les événements À, et À, sont indépendants si la relation (1.2.1) est 
vérifiée. Plus précisément les événements À, et 4, sont dits indé- 
pendants si l’on a 


P (4:-42) = P (4))-P (4). (1.2.2) 


Exemple. On tire au hasard une carte d’un jeu de cartes. 
Cette expérience concrète est un cas particulier de l'expérience à un 
nombre fini V d’issues équiprobables. Dans notre exemple est 
le nombre de cartes du jeu, soit par exemple W = 52. Considérons les 
événements À, : « on tire une carte de pique » et 4, : « on tire une da- 
me ». Il est clair qu'il y a N (4,) = 13 issues élémentaires favorables 
au premier événement, car un jeu de 952 cartes contient justement 
13 cartes de pique, donc P (4,) = #/,,; = 1/,, et N (4,) — 4 issues 
élémentaires favorables au second événement, car on a en tout 4 
dames, donc P(4:) = */5» — !/53. Enfin une issue élémentaire 
conduit à l'événement 4,-4, de «tirer une dame de pique» et 
P (4, :4:) = !/59. On voit que la relation (1.2.2) est vérifiée et par 
conséquent les événements À, et À, sont indépendants. 

Cet exemple simple suffit à montrer que la notion générale d’indé* 
pendance formulée comme ci-dessus permet de l'appliquer là où, 
malgré toute la simplicité des « conditions physiques concrètes » 
de l'expérience étudiée, il est difficile d'aborder autrement la ques- 
tion de l'indépendance des événements À, et 4. 

Notons que si dans l’exemple étudié ci-dessus on change les 
conditions de l’expérience en ajoutant aux 52 cartes d’un jeu ordi- 
naire de cartes M cartes blanches, les événements À, (tirer une carte 
de pique) et 4, (tirer une dame) seront de toute évidence liés: pour 
M grand (disons M — 1000) la carte tirée sera d’une manière presque 
certaine une carte blanche et la probabilité de tirer uhe carte de 
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pique sera infime; par contre, sous la condition que la carte tirée 
est une dame (événement 4.), l'événement 4, (la carte tirée est une 
pique) devient tout à fait réel: la probabilité de l’événement À, 
sous la condition A. doit être prise égale à 1/,. 


En général, les événements À,, 4,, . .. sont dits mutuellement 
indépendants (ou indépendants tout court) si la probabilité d’inter- 
section À; . Ai, pour à, ..., i différents quelconques est 


P (Au... 4u)=P(4:)...P (Ai). (1.2.3) 


Soient des expériences Q,, Q,, ... avec des issues possibles 
Wi. Os... On peut définir une « expérience complexe » Q comme 
l’espace des issues élémentaires © = (w,, w2, . ..), où w, est une 
issue élémentaire de Q,, w, une issue élémentaire de Q,, etc. Le méca- 
nisme de hasard de cette expérience est généralement décrit par les 
probabilités P ai ..- A;i,) des différentes intersections des événe- 
ments Ai, = Q;,, Ai, = Q;,... Si pour des événements quelcon- 
ques As ... ÀA;i,, liés aux différentes expériences Q;, ..., Q:,, 
les relations (1.2.3) sont vérifiées, les expériences Q2,, Q,, ... sont 
indépendantes. 


2. Probabilité conditionnelle. En plus de la notion d’indépen- 
dance, en théorie des probabilités on introduit la notion très impor- 
tante de probabilité conditionnelle caractérisant la dépendance de 
divers événements. 

Soient les événements À4,, À, provenant de l’expérience Q ayant 
un nombre fini V d'’issues équiprobables w. Sachant que l’expérience 
a réalisé l’événement 4, (sans préciser par quelle issue élémentai- 
re w), proposons-nous de trouver la probabilité de l'événement À; 
dans ces nouvelles conditions. 

Il est évident que dans ces nouvelles conditions on peut en fait 
avoir seulement (4 2) différentes issues élémentaires (pouvant 
chacune donner lieu à l'apparition de l'événement 4,). Si l’on 
désigne par W (4,-4,) le nombre d'issues élémentaires de w € À, 
donnant lieu à l'apparition de l'événement 4,, il serait naturel de 


définir la probabilité de l'événement À, (sous la condition que À, 


N (As-4:) 


se soit produit) comme le rapport NA (comparer avec la formule 


générale (1.1.1)). Mais il y a lieu de remarquer que le nombre 

N (4, -42) coïncide avec le nombre de toutes les issues élémentaires 

o € Q donnant lieu à l'apparition des deux événements 4,, 4, 
(c'est-à-dire à l'événement À, f] 4:). Compte tenu de 

N (41-240 N (4» 

P (4-4) éd, P(4)= 2, 


on peut exprimer la probabilité conditionnelle de l'événement À, 
sous la condition de l'apparition de l'événement 4, (désignée ulté- 
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rieurement P (4, | 4:)) par la formule suivante: 


P (41:42) 
P(4l4)=5 

Cette formule est vraie également dans le cas général (pour 
P (42) > 0). 

Vu l'importance de cette notion nous allons la préciser sur un 
autre modèle. Imaginons que l'expérience consiste dans l'observation 
d’un certain point aléatoire £ dans l’espace de phase X. Le méca- 
nisme du hasard est le suivant: la probabilité de trouver ce point 
dans le domaine À & X (événement À) est proportionnelle au volu- 
me de ce domaine, défini comme l'intégrale sur À d’une certaine 
fonction intégrable p (x) non négative 


P(4)=+ | p(dr, 


A 
où V est le volume de tout l’espace de phase 


V= | p(xdr. 
X 


Supposons que l'observateur sache que le point aléatoire & se trouve 
dans un certain domaine À, (événement À.); déterminer pour ces 
conditions la probabilité de trouver le point dans le domaine À,. 

Il est clair que sous la condition de se trouver dans le domaine 4,, 
le point £ ne peut tomber dans le domaine À, que si l'intersection 
A,f 4, est non vide, c’est-à-dire que le fait de trouver le point 
dans À, équivaut à le trouver dans l'intersection mentionnée 4, f 
N 42, ce qui a lieu avec une probabilité proportionnelle au volume 


correspondant | p (x) dx. Par conséquent, sous la condition de 


AA: 
se trouver dans le domaine 4., le point aléatoire & tombe dans le 


domaine À, avec une probabilité égale à FES | p (x) dx, où 


Ain 2 
V (4) est le volume du domaine, 4., c'est-à-dire V (4:) = 
= | p (x) dr. On voit que cette probabilité P (4, | 4.) coïncide 


A: 
P(41: 42) 


avec le rapport PA) 


La probabilité conditionnelle P (4, | À.) permet de définir la 
notion d'indépendance comme suit : l'événement À, ne dépend pas 
de l'événement À. si la réalisation de À, ne change pas la probabili- 
té de réalisation de À,, plus exactement, si la probabilité condition- 
nelle P (4, | 4.) coïncide avec la probabilité a priori P (4,) de 
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l'événement envisagé À,, c’est-à-dire 
P (4: | 4:) = P (4:)- 


Mais, comme on peut le voir à partir de la formule (1.2.4), cette 
égalité équivaut à l'égalité (1.2.2) et nous revenons une fois de plus 
à la notion primitive d'indépendance des événements À, et 4. 


Dans les applications, quand il y a lieu de trouver la probabilité 
P (4) d’un événement quelconque À lié à une expérience compliquée 
Q, il est souvent commode de supposer que soit réalisé un autre 
événement BP}, si l'introduction de cette condition simplifie l'expé- 
rience et permet de trouver la probabilité conditionnelle P (4 | B). 

Soit un système complet d'événements B;,, B;, . . . tels que l’expé- 
rience considérée réalise un événement et un seul des événements 
B,, B:, ... (autrement dit, ces événements sont disjoints et leur 
réunion est un événement certain). Ayant défini les probabilités 
conditionnelles P (A | B,) de l’événement À pour différentes condi- 
tions B3, k = 1, 2, ..., on peut trouver la probabilité P (A) de 
l'événement À à l’aide de la formule de la probabilité totale 


P (4) = > P (41 B:) P (Ba). (1.2.5) 


On peut facilement trouver cette formule en représentant l’évé- 
nement À comme la réunion d'événements disjoints 4, = À -B;, 
k —1,2,...: 


A=A-U5,-U(4:8,) 


et en utilisant l’axiome des probabilités totales (voir (1.1.12)) en 
vertu duquel 


P (4)= È P (4-B;). 


En exprimant les termes P (4-B,) en fonction des probabilités 
conditionnelles P (4 -B,) = P (4 | B;)-P (B,) on obtient l'égalité 
(1.2.5). 

Pour illustrer les possibilités offertes par l'application de la 
formule des probabilités totales nous allons étudier un exemple. 


Exemple (problème du joueur ruiné). Soit le jeu de pile ou 
face. Le joueur gagne si sort le côté qu'il avait choisi et perd dans le 
cas contraire. Dans un coup il peut gagner ou perdre 1 franc par 
exemple. Supposons que le joueur entre en jeu avec le capital initial 
de zx francs et qu'il se propose de le porter à a > x francs. Le jeu 
se termine lorsque le joueur ou bien gagne cette somme a ou bien 
perd tout son capital. Trouver la probabilité que le jeu se termine 
par une perte totale du capital. 
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Il est clair que cette probabilité dépend du capital initial zx 
et de la somme finale a. Désignons par p (x) la probabilité pour que, 
ayant x francs, le joueur soit quand même ruiné. La probabilité 
d’être ruiné sous la condition de gagner au premier coup sera avec 
les désignations adoptées p (x + 1), car le gain portera le capital 
du joueur à x + 1. D'une manière analogue, la probabilité d’être 
ruiné sous la condition de perdre au premier coup sera égale à 
p (x — 1), car la perte diminuera le capital du joueur d’un franc, 
de sorte qu'il lui restera z — 1 francs. Désignons par B, l'événement 
correspondant au gain au premier coup, par B, l'événement corres- 
pondant à la perte et par À la ruine du joueur. Les prosabilités con- 
ditionnelles de la ruine dans les désignations adoptées s'expriment 
par les formules suivantes 


PAIB)=p(&+1), P(A4IB: = p(z—1). 


Les événements B, et B, forment un système complet, car au pre- 
mier coup le joueur ou bien gagne, ou bien perd, de plus on a 
P (B,) = P(B2) = ‘/+ La formule des probabilités totales donne 
pour les probabilités cherchées p (x) la relation suivante 


p(a)=5tp(z+1)+p(r—1)l 


pour tous les x = 1, ..., a — 1 (il est évident qu'il faut poser 
p (0) = 1 et p (a) = 0). 
La solution de l'équation 


fa+1)=2#f@—-f(—-1, z=1,2,... 


par rapport à la fonction f (x), à laquelle pour 1<r<a—îi 
satisfait la probabilité p (x), s'obtient successivement en posant 
Yo — f (0), y, — f (1) pour tous les z = 2, 3, ..., et par consé- 
quent il ne peut y avoir qu’une seule solution pour des conditions 
initiales données y, = f (0), y, = f (1). Il est facile de vérifier que 
cette solution est de la forme 

Ê (à) = Yo — (Yi — Yo) %, 


et pour y = 1, y, = p (1) on obtient 
pa =1+(1—pt{())7x, 


d'où, vu que p (a) = 1 — (1 — D (1)) a = O, on trouve P (1) — 
= À — — et finalement 


p(r)=1—+, z=0, 1, ...,a. 
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$ 3. Variables aléatoires et lois de probabilité. 
Indépendance 


1. Variables aléatoires continues et discontinues. Dans le cadre 
de tel ou tel modèle de la théorie des probabilités décrit par l’espace 
des événements élémentaires Q avec des probabilités P (4) des 
événements À © Q, lorsque l’on envisage une variable aléatoire E, 
on suppose qu’elle dépend du hasard (plus exactement de l'issue élé- 
mentaire © € Q) de telle sorte que les probabilités de tous les évé- 
nements du type {x < Ë < xz”} sont déterminées. Nous parlons 
ici d’une variable aléatoire réelle, une fonction réelle £ — E (w) 
de l'issue élémentaire w € Q. 

I] y a lieu de dire tout de suite que dans les problèmes de la théo- 
rie des probabilités il est peu important en général de connaître 
la dépendance explicite de £ = E (w) de w € 2. Ce qui est important, 
ce sont les probabilités des différents événements À = {2 <E < x”} 


P{r <E<z'} (1.3.1) 


qui caractérisent la dépendance de la variable E du hasard ; dans leur 
ensemble elles montrent la répartition de la probabilité pour le 
point aléatoire E de tomber dans tel ou tel intervalle [x’, x”], autre- 
ment dit, elles donnent la loi de probabilité de la variable aléatoire E. 

Lorsque l’on envisage une variable aléatoire isolée, on peut 
prendre en qualité d'espace des événements élémentaires la droite 
réelle E*, en fixant chaque événement élémentaire {E = x} par un 
point correspondant x € ET et en déterminant E en fonction de l'issue 
élémentaire x € E* par la formule E (x) = x; le mécanisme du hasard 
de cette expérience est décrit par la distribution (1.3.1). 

Notons une fois de plus que la connaissance de la dépendance 
explicite (par exemple de la forme E (x) = zx) est peu importante 
du point de vue du comportement probabiliste de la variable aléa- 
toire E ; ainsi, les mêmes lois de probabilités caractérisent la variable 
aléatoire E(x) = zx, —oo << z<< oo, de densité de probabilité 


uniforme (p: (x) = + pour 0O<z<ZL, p:(x) =0 pour z< 0, 


x > L) et le point aléatoire sur la circonférence de longueur Z dé- 
crivant la position de la bille de la roulette (voir $ 1). 


Supposons que la variable aléatoire Eë peut prendre un nombre fini 
ou dénombrable de valeurs z avec la probabilité correspondante 


P(=PE=z) (LP: (1), 


c'est-à-dire qu'avec la probabilité 1 la variable Ë prend l’une des 
valeurs mentionnées zx (en fait ces valeurs x sont les seules possibles 
pour Ë). Une telle variable aléatoire est dite discrète ; sa distribution 
est également appelée discrète. 
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Pour z’,zx”, (x < x) 
x” 
P{r'<E< zx} Ÿ P;(»), (1.3.2) 
x’ 


où la sommation s'effectue dans l'intervalle mentionné sur un nombre 
fini ou dénombrable de valeurs possibles z pour lesquelles P : (x) > 0. 


La distribution de la variable aléatoire E est dite continue si 
on a une densité de probabilité p: (x), c'est-à-dire que (voir (1.1.2)) 
pour x’, x” (x < zx”) quelconques 

x” 


P{r' Es} | per) dr (1.3.3) 


(la densité de probabilité p, (x) est une fonction intégrable non néga- 
+o0 
tive telle que J P: (x) dx = 1). 


La variable ‘uniformément répartie £ prend chaque valeur donnée 
x avec une probabilité égale à zéro: 


P ŒE=z)= Jim | p: (x) dr =0 
WLXT0 x’ 
et pour tout point de continuité de la fonction p: (x) on a 
P{r SE<z"}- p;(x)-Ar 
vec Az = zx —r +0, z L<rLz”. 

Il est évident que la variable aléatoire E peut n'être ni discrète, 
ni continue (voir l’exemple à la page 39). La loi de probabilité de la 
variable aléatoire Ë peut être donnée à l’aide de la fonction de réparti- 
For F;(x = P{E< zx}, — 00 <T TZ << 00, (1.3.4) 
à savoir pour z’, zx” (x < x”) quelconques on a 

P{r <E<z"} = F;(z) — F:(x — 0), 
où F; (x — 0) désigne la limite lim F;(z—h) pour hk> 0. 
La fonction F- (x) satisfaisant à à l'égalité (1.3. 4) est non négative, 


monotone croissante (non décroissante) et continue à droite (F: (x) = 
= F,(x + 0)), de plus 


lim F;(x)=0, lim F:(x) —1. 


X— — 00 


Les propriétés énumérées peuvent facilement être déduites à 
partir de l’additivité et de la continuité des probabilités. L'événe- 
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ment {E < x} est l'intersection des événements monotones décrois- 
sants {E < r,}, où z,, n = 1, 2, ..., est une suite à décroissance 
monotone convergeant vers x et, vu la continuité des probabilités. 
onalimP{é<z,} = P {E < x}; en vertu de cette même propriété 


ni — 00 
pour les événements {E & z,}, z1 —— —o, dont l'intersection est 
un événement impossible (« vide»), on a lim P{E<z,} = 0; 
ñn— 00 
pour des événements à croissance monotone {E < t,}, Zn —> oo, 
dont la réunion est un événement certain {E << +}, on a 


lim P {E <z,} = 1. L'événement {£ < r’}est alors la réunion 


1 —0 


des événements disjoints {E < x} et {x < E << z”} de telle sorte 
que 

P{&<E<z"} = PE <z'}—-P{E<7z} 
et 


P(<EST)= lim P{r<ESr}=F()—F; (2 —0). 


Notons que pour une variable discrète Ë on a 
Fi (x)= XP; (y), 
yEx 


et pour une variable aléatoire à répartition continue 


x 


Fe(2= | ps (y) dy, 


— 00 


où p: (x) est la densité de probabilité correspondante, coïncidant 
en ses points de continuité avec la dérivée de la fonction de réparti- 


tion 
Py(z) = Fi (x). (1.3.5) 


2. Répartition simultanée. Soient deux variables aléatoires E, 
et E, dépendant de l'issue élémentaire w € ( d’une même expérience. 

On peut considérer l'expérience consistant à observer les variables 
aléatoires E,, E., plus exactement pour l’espace des événements élé- 
mentaires on peut prendre le plan réel Æ*, en fixant chaque événe- 
ment élémentaire {E, = x, ë. = z.} par un point correspondant 
(z;,, ze) € E* et en déterminant formellement la dépendance des 
variables E,, E. des événements élémentaires (x,, ze) € E? par la 
formule E, (x,, ze) = 2, Ëo (Ty, Te) = Ta ; le « mécanisme du hasard » 
de cette expérience est donné par la répartition simultanée des proba- 
bilités, c’est-à-dire par les probabilités 


P{H<U <<: LB: <<} 


des différents événements À ={r SE Ti, EL < be KT}. 
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Notons que l’on peut considérer E,;, ë., comme les coordonnées 
d'une variable aléatoire & = (E,, ë.) dont la distribution est donnée 
par les probabilités pour le point E de tomber dans différents domai- 
nes rectangulaires du type À = [x;, x] X [zx;, x]: 


P{ÉEA}= PE << <T; & <br KT} 


Pour des variables discrètes (E,, &.) la distribution est donnée 
par les probabilités 


P:,, £s (ir 7) = P {Er = dd; Ëe — Ze}, — 00 < Ti, La < OO, 
à savoir 
x1 x2 
P{HSUSz; <br} 2 D Parmi, 2), (1.3.6) 
X1 Xe 


où dans les limites mentionnées la sommation s’effectue sur un nom- 
bre fini ou dénombrable de valeurs (x,, x.) pour lesquelles 
Pr, à (tr Te) > 0. 

Les distributions de chacune des variables E,, E, séparément peu- 
vent être données par les formules 


Pas (1) = Zn Pos; 2 (Ts Te) 


et (1.3.7) 
Pa (Ze) = 2 Pas, ge (ts Te) 
—0<x1<oo 
obtenues à partir de (1.3.6) pour z;, = —oo, x, — oo et z, = —o, 
TZ, — C0. 


On dit que la distribution simultanée des variables aléatoires £,, 
ë, est continue si la densité de probabilité existe, autrement dit, si la 
densité de la distribution simultanée p:,,+:, (x, x.) est une fonction 
non négative intégrable du couple de variables (x,, x.) € E*?, à savoir 


+oo +oo 
Pgs, E2 (Lis Te) Ari dte = 1, 
telle que 
x1 x2 
P{H<UST,; 2er} — Piste (T1, Te) di dt. (1.3.8) 
x1 x£ 


La formule (1.3.8) peut s’écrire comme suit: 


P {@r )€4}= | À Per te(r 2) du dus. (1.3.9) 
A 
3—0521 
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Montrons que cette formule est valable non seulement pour des 
rectangles À = [x;, x] X [x,, x,] mais peut être généralisée à 
des domaines de forme plus compliquée, par exemple à des domai- 
nes quelconques À à la limite lisse par 
morceaux. 

Remarquons tout d’abord que la pro- 
babilité pour le point de tomber dans le 
rectangle fermé [x;, x] X [x:, x°] et dans 
le rectangle semi-ouvert (x;, xz;] X (r:, x] 
est la même, car la probabilité de trou- 
ver le- point aléatoire (E,, &.) du plan 
E*? sur la limite du rectangle est nulle. 
Ceci découle de la formule (1.3.8) et de 

Fig. 8. la propriété de continuité de la probabi- 

lité. Ensuite, si la formule est vraie pour 

des rectangles semi-ouverts du type (x;, xl X (x, x;], on peut, 

en utilisant la loi des probabilités totales, généraliser la formule 

(1.3.8) à des rectangles À admettant la décomposition en rectangles 
disjoints À, du type mentionné: 


P {(E:, Ée) € A}= D P {(E:, Es) € An} = 


= ÿ | | Pys, 52 (Ti, Te) dr dre = | | Pts, 2 (is Le) di dre. 
k A 


Ah 


Notons le fait important que les rectangles semi-ouverts À, restent 
disjoints même s'ils sont adjacents (ce qui n’est pas vrai pour des 


rectangles fermés). 
Soit maintenant le domaine À à la limite lisse par morceaux, on 


peut y inscrire le rectangle 4’ (4° = À) (fig. 8) du type envisagé 
ci-dessus, de telle sorte que pour e >> O0 quelconque donné on ait 


P {6€ 4} — | | Pis, te (Tir Ta) dt da > | | Ps, te (His Te) das dre — €. 
A° A 


Comme pour 4’ = À l'événement {E € A’} fait partie de l’événe- 
ment {EE A},ona P{EE A}> P{E € A'}et a fortiori 


P {EC A)}> | | DEs, te (Lis Te) AT do — €. 
A 
D'une manière analogue, en utilisant le polygone correspondant 
A” décrit autour du domaine À (A © À”) on peut obtenir l'inégalité 


P {EE A}< | | Per, E2 (Lis Te) dri dre + €. 


A 
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Comme & est arbitraire, on en conclut qu'en réalité 
P(EA)= | [pas (s, 2e) duidas, 
A 


ce qu’il fallait démontrer. 


Notons que si les variables aléatoires E,, Ë, ont une distribution 
simultanée continue de densité de probabilité pes, :, (2, z2), Chacu- 
ne d’elles a également une densité de probabilité; en utilisant la 
formule (1.3.8) pour x; = —oo, x; = oo et z, = —oo, z° = oo, 
il est facile de vérifier que 

+ 00 
Pa (x) = | Pas, &2 (A1s Ta) dr? 
et (1.3.10) 
+o 
Ps: (22) = | Pis, 2 (Aus Te) dr. 


L'inverse n'est pas généralement vrai. Pour des variables E, et E£, 
ayant séparément des densités de probabilité pe, (2) et pe, (x), 
la densité de la distribution simul- 
tanée peut ne pas exister. Ce sera ‘2 Ÿ 
par exemple le cas de Ë, = E, et #A 
P {x $2) € A} = 0 pour un do- 
maine quelconque À du plan (x,, 22) 
qui ne se coupe pas avec la droite 
%Z = ZT; pour un domaine quelcon- 
que À on a 


P{(, &)€4}= | pu(z)dz, | 
B 


où B désigne un ensemble sur l'axe 0 B ZT, 
z, obtenu comme l'image de l’in- | 

tersection de À avec la droite x, = x, Fig. 9. 

par l’application (x,, x.) — zx, (fig. 9). 

Les variables aléatoires E, et £. sont dites indépendantes si pour 
des intervalles quelconques Î[zx;, x°l et [x;, z°] les événements 
{x LE, L'ri}het {x LE, L x} sont indépendants, c’est-à-dire si 
PIL<h << EE: LT} = 

= P {x Shi SP (<br <r} 


Il est facile de voir que pour des variables discrètes E, et &. 
l'indépendance signifie que la distribution simultanée est donnée 
par la formule 

P:.. ë, (x, La) = P:, (x) -P>. (ze). (1.3.11) 
3% 
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Dans le cas de variables indépendantes continues E, et £E, on a 
P {rh <T; RCE) 
n 


| [P Pg (21) Pa (r2)] di dre 


= ( P&1 (21) dx 1 Pr (t2) d22 = Î 


LA 
X1 Xe 1 


pour tous les intervalles [x;, z°] et [x;, zx:]. On voit que la densité 
de probabilité simultanée existe et est égale à 


PE, Es (mi, Ta) — Di; (1) Pis (22). (1.3.12) 
Il est également facile de voir que si la densité de probabilité simul- 
tanée De,, #, (2, 22) est donnée par la formule (1.3.12), les variables 
aléatoires &, et £. sont indépendantes. 


LS. Transformation des variables 
aléatoires. Nous allons voir mainte- 
nant comment varie la distribution 
des variables aléatoires lors de telle 
ou telle transformation. 

Dans le $ 1 nous avons déjà mon- 
tré; que lorsqu'une variable aléatoire 
ë de densité de probabilité p; (zx) subit 
une transformation biunivoque y — 
—@(x), où p’ (rx) 0, la densité de 
probabilité p, (y) de la variable n = 
— @(E) est donnée par la formule 
(1.1.4). La méthode de changement de 

Fig. 10. variable utilisée pour la déduction de 

cette formule est également applicable 

dans le cas où en certains points (x) = O la transformation 
y = (zx) n’est pas biunivoque. 


Exemple. Soit la transformation y = 2. Il est clair que 
pour la variable aléatoire n = E* on a (fig. 10) 


P{y' <n<y }=P (—r<i<—r}+P {(r' <KE<z}— 


= ll padr+ | m6 de | 1m (9 + nr 


x" 


ir (Vu) + (Vu d 
et la densité de probabilité de n vaut | 
y 


Pn (y) = 
0, y<0. 
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Dans le $ À nous avons montré que pour des variables aléatoires 
(£E:, &+) de densité de probabilité p:,,:, (2, x.) lors d’une transfor- 
mation biunivoque du plan yi= ®m; (21, Te), Yo = Po (L1, T2) avec 
un jacobien régulier 
991 09: 

CET ÔTa 
0Q2 ps 
CE ÔTe 


[1= 


la densité de probabilité p,,,n, (Y:1, Y2) des variables aléatoires 
a = Où (Es Es), Me — @s (Ex, Ë) est donnée par la formule (1.1.7). 
Cette formule est également vraie pour des transformations pour 
lesquelles le jacobien | Z | s’annule pour certaines lignes divisant 
le plan E* en domaines disjoints à l’intérieur desquels le jacobien 
| Z | ne s’annule pas. 

La formule (1.1.7) peut être utilisée également dans le cas où il 
s’agit d’une transformation du type n = ® (E,, &2). Si on peut intro- 
duire la transformation auxiliaire 9, = n, 2 = » (61, ë<) donnant 
une densité Pn,, n; (Y1» V2) de la forme (1.1. 7), la densité de probabi- 
lité p, (y) de Ta variable n sera (voir (1.3.10)) 


Pa = À pastel (us ve), veus v2)1| TI due. (1.313) 


Exemple. Soient £, et &. des variables aléatoires indépendan- 
tes de densités de probabilité p, (x) et p, (x). Nous nous proposons 
de trouver la densité de probabilité de leur rapport E./E.. 

Remarquons tout d’abord que, comme E, = 0 n’est vrai qu'avec 
une probabilité nulle, la variable n, = &,/E, prend des valeurs 
finies avec une probabilité égale à 1. Soit la transformation 


n= Y2 = Lo (m=£t., m=b) 


de jacobien | Z |"! = | y, |. La densité de probabilité p,,,n, (Y:, Ye) 
des variables n,, n° dans chacun des domaines y, << 0 et y, > 0 est 
donnée par la formule (1.1.7), soit 

Pa(ys-Uz) Pa(Y2) ya pour y:>0, 


Pr: n, (Ya Ye) = — Pi (yi°U2) Pa (ya) Ye pour y 0. 


La densité de probabilité de la variable n, prise isolément est 


Pn, (y:) = | Pass Ne (Yss Yo) dYes —0 Ly << oo, 
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et dans le cas étudié on a 


oo 0 


Pa (W)= | palyz) pe (x) zdz— | pi(ux) pe (x)zdx. (1.3.14) 
0 — © 


Exemple. Soient E, et &. des variables aléatoires indépen- 
dantes de densités de probabilité p, (x) et p, (x). Trouver la distribu- 
tion de leur somme E, + E.. 

On peut compléter la transformation œ, (x,, x.) = x, + x, jus- 
qu’à une transformation régulière du plan en posant @, (x, ze) — 22. 
On a alors |Z | = 1et 


Ve (Vis Ye) — Yes Vi (Vas Ye) = Yi — Ye. 


Pour des variables indépendantes E;, E, 
la densité de probabilité mutuelle est 
Päe &s (Zi Ze) = Pi (1) P2 (&2) et pour les 
variables "1 — ë] + Ë, 2 — Eo la den- 
sité de probabilité sera D,,n, (Yi, Ye) = 


— P1 (Y1 — Y3)-P2 (Ye). Par conséquent 
# Ja densité cherchée Pn, (Y) est 


_ 
| 
| 

2 


0 / 


Fig. 11. ce 
Pa W)= À Pa(y—2) pa (x) dr. (1.315) 
Cette expression pour la densité de probabilité de la variable aléatoi- 
re E, + £, est appelée convolution ou composition des densités p, (x) 
et Po (x). 

Soient E., £: des variables aléatoires indépendantes uniformé- 
ment réparties sur le segment [0, 1]. La densité de chacune d'elles est 


14 pour 0£zr<1, 
p(a={ O0 [pour r<0, z>1, 


et pour la somme n = E, + E. on obtient à partir de la formule 
(1.3.15) une distribution triangulaire de densité (fig. 11) 


v 
| dy=y pour 0<y<1, 
0 
Pn(y)=}) : 
| dr=—2—y pour 1<y<2,; 
y-i 
0 pour y<<0, y>2. 


4. Distributions conditionnelles. La dépendance de différentes 
variables £& et n entre elles (ou celle de la variable £ d’un événe- 
ment B) peut être caractérisée par la distribution conditionnelle. 
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Sachant que l'événement B est réalisé, on peut décrire le comporte- 
ment probabiliste de la variable aléatoire Ë par les probabilités 
canditionnelles P {x SE < zx” | B}, différant dans le cas général 
des probabilités initiales P {17 << E < z”}. 


Exemple. Supposons que l’on ne puisse observer que l’une 
des deux expériences Q, ou (2, auxquelles sont liées respectivement 
les variables £, et E.. Pour choisir l’une des expériences Q, ou Q, 
l'observateur tire au sort, de telle sorte qu'avec une probabilité 
donnée g, il choisit (, et avec une probabilité g, il opte pour QG, 
(q1 + 9e = 1). Finalement au lieu des variables E, et £, on voit 
apparaître une variable aléatoire ë = nE, + (1 — n) £:, où n ne 
dépend pas de E&,, E. et avec les probabilités q;, g, prend respective- 
ment les valeurs 1 ou 0. Il est facile de voir que sous la condition 
n = 1, & coïncide avec £, et sous la condition n = 0 avec E.. Par 
conséquent, la distribution de la variable aléatoire Ë est 


P{r <E<zr'In=1}=P{<E<z"} 
P{<E<z In =0}=P{r <E:< z’}, 
d'où, en utilisant la formule de la probabilité totale, on obtient 
P{r'<E<z”}=nP{r <E <T'} + ge°P (2 Kb: <r}. 


Si, par exemple, E, est une variable discrète pouvant prendre diffé- 
rentes valeurs de z avec les probabilités correspondantes P:, (x) 
et £. une variable uniformément répartie de densité de probabilité 
ps, (x), on a | 


x” x” 
P{r GES }=q D Pa(a)+ qe | prs(x) dr. 


Si ë et n sont des variables aléatoires discrètes, pour l’événe- 
ment B du type {n = y} la variable E liée à n n'aura plus la distri- 
bution primitive P; (x), mais la distribution conditionnelle P, (x | y) 
qui. en vertu de la formule générale (1.2.4), sera définie comme suit : 


Py,n (> y) Py,n(e, y) 
P:(xly) F,@ S Part u 00 <Z z << oo, (1.3.16) 
+< 

où x prend toutes les valeurs possibles de la variable discrète £ et 
P:.n (x, y) est la distribution simultanée de £& et n. 

D'une manière analogue, si & et n ont pour densité de probabilité 
simultanée Ps, n (Tr, y), on peut dire que, pour un n= y fixe, E a pour 
densité de probabilité conditionnelle p; (x | y) définie par la formule 


P. lg = 2 Re. — 00 <r< 00. (1.317) 


Ps, n (7, y) dx 
CC 
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Les formules (1.3.16), (1.3.17) montrent que si la variable aléa- 
toire £ ne dépend pas de n, sa loi conditionnelle (sous la condition 
n = y) ne dépend pas de y et coïncide avec la loi initiale (incop- 
ditionnelle). 

Nous avons les inégalités suivantes (comparer avec la formule 
de la probabilité totale) : 


Pr (a)= 2 Ps (alu) Pay) (1.3.18) 
pour des variables discrètes E et n et 


Pe (x) = | Ps (Z|Y) Pn (y) dy (1.3.19) 


pour des variables E et n de densités de probabilité p; (x) et pa (y). 


Pour illustrer l'utilité des lois conditionnelles considérons la 
somme de variables aléatoires indépendantes E,, £. de densités de 
probabilité p, (x), p. (x). Proposons-nous de trouver la distribution 
de la variable n = Ë, 

Remarquons tout d’ abord que la distribution conditionnelle 
de n sous la condition E, — x coïncide avec la distribution de la 
variable E, + x de densité de probabilité p, (y — x), — 00 << y << co 
(rappelons que EË, ne dépend pas de £, et donc la densité de probabilite 
conditionnelle de E, coïncide avec la densité inconditionnelle p, (y)). 
A partir de la formule générale (1.3.19) on obtient l'expression 
(1.3.15) que nous connaissons déjà : 


Pa(u)= | pa(y—2) ps (a) dz. 


5. Variables aléatoires multidimensionnelles. Il s’avère bon 
parfois de considérer l’ensemble de variables aléatoires E,, . .., E, 
(prenant les valeurs numériques z,, . .., z,) comme une variable 
aléatoire vectorielle E — (E,, . .., E,) de coordonnées E;, ..., ë, 
prenant suivant le cas une valeur zx = (x,, ...,x,) dans l’espace 
vectoriel à nr dimensions £”. 

Pour des variables discrètes la probabilité pour le point E de se 
trouver dans un certain domaine À = E” est 


P (EeA}= 2 Py(x), (1.3.20) 
où les probabilités 


P;(z) = P{E=2} =P{E=m,...,E, = x,} = 
= Pr, nf...) (4.3.2) 
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donnent la distribution simultanée ou la loi conjointe des variables 
Ej, + < - En. Pour des variables à répartition continue E;, ..., E, 
de densité de probabilité 


P (x) = Pys,...,En (Zis ++, Tn) 


(px (x) > 0, | .…. ET dti ... din =) 


la probabilité de l’événement {E € A} est donnée par 
P &€4}= | .. {re (x) dx. (1.3.22) 
A 


La seule différence avec la formule (1.3.9) est en ce que la variable 

z = (x,, x.) dans le plan E* se trouve remplacée par x = (x;, ... 
+; Zn) € ET. Compte tenu de cette différence, tout ce qui a été dit 
sur les variables unidimensionnelles est vrai dans le cas multidi- 
mensionnel. En particulier, les formules (1.3.7), (1.3.10) sont géné 


ralisées d’une manière évidente au cas de #7 variables (zx;,, . .., 
il en est de même des formules des transformations (1.1.4), (1. 1! 7) 
et (1.3.13). 


L'indépendance des variables vectorielles E, et E, (exprimée par 
les relations (1.3.11), (1.3.12)) a le même sens que dans le cas des 
variables ordinaires. De même, les formules (1.3.16), (1.3.17) don- 
nant les lois de probabilité conditionnelles restent vraies dans le cas 
des variables vectorielles. 

L'unique notion vraiment nouvelle apparaissant en rapport avec 
l'ensemble de variables aléatoires Ë,, E+, . . . est leur indépendance 
mutuelle (ou plus brièvement leur indépendance). Notamment, les 
variables aléatoires E,, ë,, . .. (unidimensionnelles) sont mutuelle- 
ment indépendantes si pour x;, x’ ;z:,x,;... quelconques les événements 


<< (ES b:< TL}, 


sont mutuellement indépendants. Dans le cas discret l’indépendance 
des variables E,, ..., &, se traduit par la relation 


Pas, ..., Èn (Zi …..) Tn) = Pa, (x) ... Pen (za), (1.3.23) 
dans le cas continu par la relation 
PEss -.., En (ti -..r En) = Pi (21) + + + Pen (zh); (1.3.24) 


OÙ Pr, (21), - - +, Pin (Zn) sont les densités de probabilité des varia- 
bles E1, ..., En €t Ps, ..., En (Lis + + +» Zn) la densité de probabilité 
conjointe. 
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$ 4. Espérance mathématique des variäbles aléatoires 


1. Espérance mathématique : définition et formules. Soit E une 
variable aléatoire discrète qui prend les valeurs possibles z avec 
la probabilité correspondante P, (x). On dit que la variable aléatoi- 
re Ë possède une espérance mathématique ME finie: 


ME = 2 zP% (x) | (1.4.1) 


(appelée également valeur moyenne) si la série dans (1.4.1) est absolu- 


ment convergente ( >, [x | P, (x) << oo). 


Exemple. La valeur moyenne de la variable aléatoire & 
pouvant prendre l’une des N valeurs possibles z = x,, ..., zx 
avec une même probabilité 1/NV est égale à 


LS 
ME=- > Th. 


k=1 


Soit la variable aléatoire n =  (Ë), où y = (x) est une fonction 
de la variable zx, admettant l'espérance mathématique. La valeur 
moyenne Mo (£) est donnée par la formule 


Mo (E) — à px) Ps (2), (1.4.2) 


où la somme est prise sur toutes les valeurs de x pour lesquelles les 
probabilités P}; (x) > 0. 

En effet, la variable discrète n =  (£) ne peut prendre que les 
valeurs y = œ (x), où x parcourt toutes les valeurs possibles de la 
variable discrète E, avec P, (y) = Ÿ P;(x). Il est facile de 

x:Nx)=y 


voir que si la série Ÿ yP, (y) est absolument convergente on a 
Mn= D up y 2 Pet)= 2 9(9 Pi(). 


D'une manière analogue, la valeur moyenne d’une certaine 
fonction n =  (E.,, £.) de variables E,, £., de distribution conjointe 
Pa, 5: (&s Z2), est 


Moi, E)= 2 D ir, ze) Pans(ti ze) (1.4.3) 
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(du point de vue formel (1.4.3) coïncide avec (1.4.2), à condition 


de poser 
E — (£1 Ée) et x — (m1. 22). 
En vertu de la formule (1.4.2), l'espérance mathématique de 


[E les MIE = Y ]z | P; (x), de sorte que la condition de 


Où 
convergence absolue de la série > [zx |2P : (x) peut s'exprimer com- 
— © 


me MIEI|<o (remarquons que l'expression M |E | = 


= => |z | P£ (x) a toujours un sens, seulement il peut se faire 


que M [8 1 = co). 
L'espérance mathématique est douée des propriétés suivantes. 
La valeur moyenne d’une grandeur constante est égale à cette 
même grandeur et en particulier 


M 1 = 1. 
Si l'espérance mathématique M Ë existe, quel que soit le facteur 
constant k on a pour la variable 4-E 
M (4-E) = &-ME. 


Pour des variables E, et &. quelconques d'espérances mathémati- 
ques ME, et ME. on a 


M(E+6) =ME +ME.; (1.4.4) 
Si E1 < Ee 
ME, < ME: ; (4.4.5) 
pour des variables aléatoires E, et E. indépendantes on a 
M (&1°63) = ME: ME. (1.4.6) 


Pour prouver la véracité des relations mentionnées nous allons 
utiliser les formules (1.4.2), (1.4.3). Pour o (x) = k-rona 


My (&) =ÿ kexP3 (x) = kY zP3 (x) = kME. 
En posant @ (x, Ze) = 7 + zx, on obtient 
Me Gi &)= 2 D SH 2 D Peu te (Ti Te) + D Re 2 DE te (T1, Te), 
ce qui (voir également (1.3.7)) montre que l'égalité (1.4.4) est vraie. 


Si p (x, x.) est une fonction quelconque, non négative pour toutes 
les valeurs z,, z, pour lesquelles les probabilités P:,, :, (x,, z) > 0, 
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on a 
M (Ëss E) — à P (Zi Lo) Pr, 82 (Zi z2) >0, 


et en particulier M (£, — £,) > 0 pour £, — £, > 0, d'oùME, < 
< M £,. Pour des variables indépendantes E, et E. la répartition 
simultanée est donnée par la formule (1.3.11) et pour œ (x;, x.) — 
= Z:Z, 0N A 


MPG E)= 2 2 (m2) Pas (ui) Pas (te) = 


_ à TiP 3 (x) Ù Te Ps: (te) = ME: ME. 


On peut généraliser la formule (1.4.4) à un nombre fini quelconque 
de variables aléatoires E,, . .., E, admettant les valeurs moyennes: 


M&+...+6) =ME +...+ME,; 


il en est de même de la formule (1.4.6), à savoir, pour des variables 
Ets + - + En mutuellement indépendantes on a 


M (E1, - -., En) =Mb...ME,. 


Soit une variable aléatoire quelconque (pas forcément discrète) E. 

La définition de l'espérance mathématique M E est basée sur le fait 

que toute variable aléatoire Ë peut être approchée avec une précision 

aussi grande que l’on veut par des variables discrètes. Par exemple, 

en partageant la droite réelle —oo < zx << o par des points 

Thin (—00 <<Lk Lo, SUP |Ti.n Th-1n | = En) et en définis- 
k 


sant les variables aléatoires discrètes £, comme suit: 
En — Lh,n pour Lhy,n < E << TR, n? 


on obtient évidemment que | E, — E | < e,, et pour e, — 0 la 
suite des variables discrètes E,, nr — 1, 2, ..., donne une approxi- 
mation aussi bonne que l’on veut de E. Si les variables E, admettent 
les espérances mathématiques M E, (c’est-à-dire M | E, | << oo), 
en vertu de l'inégalité générale (1.4.5), on a 


IME—MËmI< M IE — Em |< En + Em 0 

(| En — Em 1< lEn — | + lEm—51< En + Em) 
et par conséquent la limite lim M E, existe. Cette limite est appelée 
espérance mathématique (ou valeur moyenne) de la variable aléatoire E : 


ME=lim Dr nP(rruin LES n). (1.4.7) 


No — 0 
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(Il est facile de voir que pour une suite quelconque de variables E,, 
— 4, 2, ..., du type mentionné, autrement dit pour une parti- 

tion quelconque de l’axe réel en intervalles (x,_,.n, Zr.nl, pour 

SUP |Th.n — Thin | — 0 on aura la même limite de M E dans 
k 

(1.4.7).) 

Il est évident que les relations (1.4.4)-(1.4.6) restent vraies lors 
du passage à la limite que nous avons utilisé à partir des variables 
discrètes à des variables aléatoires quelconques. 

Nous allons montrer que pour la variable aléatoire & de densité 
de probabilité p; (x) l'espérance mathématique est 

ME — | zpe (x) dx (4.4.8) 


(où l'intégrale est absolument convergente : | | x | Pe (x) dr << oo). 


En effet, posant œ (x) = x et à: (x) = Th.n AVEC Thon 
TL Tr,n, On obtient | 


o *k,n co 
ME = ÿ» | Th, nPz (x) dr — | Pn (x) Ps (x) dx, 


TO Xp_in 


ou 


© Les) 


| [où to Ps (x) dx — | px) pe (a) dr | < | [Pn (x) — px) 1 x 


—o 


X pe (x) dr Ken | pelx)dr=e, +0 pour n—+00 


— © 


et par conséquent M E, —+ | p (x) pe (x) dx, c’est-à-dire M & — 


= | zp£ (x) dr. (Il est facile de voir que la condition M |E, | = 


— 0 
co 


= | | Pn (x) | pe (x) dr << oo supposée dans la définition de 


© 


l'espérance mathématique M E équivaut à ce que | | p (x) 1P£ (x) X 
X dt <Z oo, (x) = z.) : 

En utilisant une méthode analogue d’approximation de la fonc- 
tion y — o (x) par des fonctions œ, (x) constantes par morceaux, 
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on trouve pour la variable aléatoire n = œ (&) sous la condition 


Î l() Ip; (dr < oo que 


—œ 
es) 


M (&) = | ® (x) DE (x) dx. (1 4,9) 


—œ 


On a la même formule pour la variable aléatoire n = g (E,, E.) 
avec £ = (£,, E2); plus exactement 


M9 (E, Ee) = | | P (Zi, Te) Ps, 3e (21, Te) dridte, (1.4.10) 


— 00 — 


OÙ P£,,£, (Tir Te) est la densité de probabilité des variables E,, E., 
et la condition de l'existence d’une espérance mathématique finie 
(M]o (E,, 2) | << oo) est équivalente .à : 

| | [P (xs, Ta) | Pas, $e(Tis Le) dx; dTe <To0o. 


—œ —00 


Exemple. Soit & une variable aléatoire uniformément répar- 
tie sur le segment [a, b], c'est-à-dire dont la densité de probabilité est 


1 
Pz (x) = { b—a 
0 pour za, r>b. 
La valeur moyenne de E est alors 
b 
b 
ME — | ZPr (x) dr =. 


Considérons une variable aléatoire £ « du type mixte» (voir 
l'exemple à la page 39) pouvant prendre une valeur x avec la proba- 


pour aSz<b, 


bilité P, (x) (>: P& (x) = ) et se trouver en général dans un inter- 


valle [zx’, z"] avec la probabilité 
x” x” 
P{r'<Egr}= D Pi(z)+ | pe(r)dr, 


où p. (x) est une certaine fonction non négative, | Pz (x) dx = qe, 


Q + qe = 1. Les probabilités Py, (x) = g:'-Py (x), —o <r< ©, 
et la densité ps, (x) = g:"-pz (x), —o0 zx << o8, donnent ainsi 
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les distributions respectives d’une variable discrète, disons, E, et 
d'une variable uniformément répartie &.. L’espérance mathématique 
M £ d’une variable « mixte » £ peut s'exprimer par la formule sui- 
vante (comparer avec (1.4.1), (1.4.8)) : 


00 00 


ME = gME1 + gME: = SP; (x) + | zpe(x)dr. (1.411) 


La notion d’espérance mathématique M E peut également être 
généralisée au cas de variables aléatoires complexes de la forme 
E = E, + it., où Ë, et E. sont des variables aléatoires réelles. On 


suppose notamment 
M E = ME +ME.. 


J1 est facile de voir que toutes les propriétés énoncées des espérances 
mathématiques sont également vraies pour des variables complexes 
E — E, + ië, (et en général pour des fonctions à valeurs complexes 
 (E1, +), voir en particulier (1.4.3) et (1.4.10)). 

Notons en conclusion que les formules (1.4.2), (1.4.3) et (1.4.9), 
(1.4.10) peuvent d'une manière évidente être généralisées à des 
variables aléatoires multidimensionnelles E — (E,, ..., E,). 


2. Moments, variance et inégalité de Tchébychev. On appelle 
moment (d'ordre k) de la variable aléatoire E la valeur moyenne M E*. 
En vertu des formules générales (1.4.2) et (1.4.9), on a pour une 
variable discrète 


ME" — Ÿ 2P. (x) 


et pour une variable uniformément répartie 


ME“ — | x ps (x) dx. 


Le moment deux M E* est généralement appelé valeur quadratique 
moyenne de la variable aléatoire E. 

Pour des variables £,, &, quelconques (ayant un moment deux 
fini) on a l'inégalité suivante (de Cauchy-Bouniakovski) : 


Mit: |<V MEË-V ME. (1.412) 
En effet, comme | E,-Ee | 1/2 (E° + E5), le fait que les moments 


deux M £‘ et M E° sont bornés permet d'affirmer que M | E,-E, | < 
<< ©. Puis on remarque que la forme quadratique définie positive 


Mn lb l+ ze ls D) = 2 ME + 227-MIEEI|+m-ME 
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des variables z,, x, a un déterminant non négatif égal à M £’-M E — 
— (M IE -E. |), ce qui prouve l'inégalité (1.4.12). 
Posant £, = E, Ë. = 1, on obtient à partir de l'inégalité (1.4.12) 


MIE| <Y ME. (1.4.13) 
De (1.4.12) on déduit également l'inégalité, importante suivante: 
VMIG+EP<VME+VME. (1.444) 


En effet, 
M {fi + be ff = MES + 2MEibe + ME < 
<ME+2 VME-VME+ME=(VME+VME) 
Enfin, quel que soit £ > 0, on a l'inégalité de Tchébychev 
P{IE>e)x- EL. (1.415) 


Il est facile de déduire (1.4.15) à partir de l'inégalité générale 
(1.4.5). En effet, posant 


0 pour |E|<E, 
u= | 


e pour |[Ë|=>e, 


on a de toute évidence E<]|E| et 
MIEÉF>ME=Ee.P{|E]>Ee)}, 


ce qui équivaut à la relation (1.4.15). 

L'inégalité de Tchébychev montre que si la valeur quadratique 
moyenne M &° est petite par rapport à e°, disons M E?/e°? <6, et que 
pratiquement on peut négliger la possibilité de réalisation de l’évene- 
ment {|£ | > e} de probabilité petite 6, la variable aléatoire E 
sera également petite, à savoir |[E | <e; en particulier, si 
M IE =0, on a E — O0 avec une probabilité 1 (en général, si 
E>0etME =MIVE [ — 0, on a E — 0 avec une probabilité 4). 


Considérons la différence Ë — a, où a = ME est l'espérance 
mathématique de E; on appelle variance de la variable aléatoire E 
et l’on désigne par jDE la valeur quadratique moyenne de la diffé- 
rence Ë£ — a, c'est-à-dire 


DÈ=M(E— a). 
En vertu de l'inégalité de Tchébychev on a 
P{IE—el>e<Te, 


ce qui veut dire que si la variance DE est relativement petite, la 
variable aléatoire & prend une valeur voisine de a avec une probabili- 
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té élevée (et en ce sens diffère peu de la constante a): 


. D 
P{lè—age}>1—L, 
en particulier, si DE = 0, on a E = a avec une probabilité 1 (il est 
évident que la variance d’une grandeur constante E — a est toujours 
égale à zéro). 
Notons les propriétés suivantes de la variance. On a la formule 


DE = ME° — 0° (a = ME). 
(En effet, M(E—a)° = ME°— 2a- ME + a° — ME° — a°.) 


Pour un facteur constant quelconque *Æ on a pour la variable 


aléatoire k-E 
D (k:'E) = k°-DE. 
Soient £&, et Ë. des variables aléatoires indépendantes. On a alors 
D (1 + 2) = Di + DE. (1.4.16) 


En effet, posant a; — ME et ae —Mé:, on a en vertu de la 
relation (1.4.6): 


M (E1 — a) (Es — ae) — M (Ë — a) M (Ës — ae) = 0 
et 
D (E + Ee) = M [(E1 — &) + (Ëe — G2)]° = 
= M (E—@)* + 2M (61 — a) (Ë — ae) + M (6: — a2)° =- 
= M(£ —a) + M (Ë2— a)" = DE + DE. 


La formule (1.4.6) se généralise évidemment à un nombre quel- 
conque de variables aléatoires E,, . .., ë, mutuellement indépen- 
dantes : 


D (+... +En) = Dhi+...+ DE. 


3. Espérance mathématique conditionnelle. Si l’on sait qu’un 
certain événement B s'est réalisé, le comportement probabiliste 
de la variable aléatoire E (liée d'une certaine manière à l'événement 
B) est décrit par les probabilités conditionnelles P {2 <E < zx” | B}. 
La valeur moyenne de la variable E dans une telle distribution condi- 
tionnelle est appelée espérance mathématique conditionnelle (ou valeur 
moyenne conditionnelle) et se désigne par M(E | B). 

Ainsi, par exemple, l'espérance mathématique conditionnelle 
de la variable aléatoire È = nE, + (1 — n) £:, où n ne dépend pas 
de Ë,, Ë. et prend respectivement les valeurs 1 et 0 avec les probabi- 
lités gi, Qe (Qu + 9e = 1) (voir page 39), sachant que l'événement 
{n = 1} a eu lieu (dans ce cas E coïncide avec E;) est M(E | n = 1) = 
= M E,; dans le cas de l'événement {n = 0} (£ coïncide avec £.) 
onaM(ŒEIn =0) =ME.. 


4—0521 
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Pour une variable discrète E dont la distribution conditionnelle 
est P:(r |B) = P{& =zxz|B}, l'espérance mathématique condi- 
tionnelle, en vertu de la formule générale (1.4.1), est 


Les 


M(EIB)= 2 xP;(x|B). 


En particulier, s’il s’agit d'un événement B du type {n = y}, dans 
le cas des variables discrètes Ë et n la moyenne conditionnelle cor- 
respondante est 


MŒly)= À zP(z|y), 
où P; (x | y) est donnée par la formule (1.3.16). Pour des variables 
à répartition continue la moyenne conditionnelle de la variable E 
sous la condition {n = y} sera (comparer avec (1.4.8)) 


O0 


MŒly== | sm (zlyaz, 


— œ 


où la densité de probabilité conditionnelle p; (x | y) est donnée par 
la formule (1.3.17). D’une manière analogue on définit la moyenne 
conditionnelle M (E | y, . .., y.) par rapport à plusieurs grandeurs 
NM - - Mn (sous la condition que M, = ÿ, - - .; Mn — Yn). La 
distribution conditionnelle correspondante pour des variables discrè- 
tes E, n1, - .-., nn est définie par les probabilités 


Pains... nn Er Vis --.s Un) 


Pa (z|yi, --.: Yn) = P 


9 


nt. co. Nn (Yi, ... Un) 


et pour des variables continues par la densité de probabilité 
PE nt: ... Nn (z, Yi Yn) 


Ps (x | y, ss Un) — Pris nn (Yi -*-+ Yn) 


Dans la suite, pour unifier les désignations dans le cas multidi- 
mensionnel, au lieu de (y,, . .., y,) on écrira simplement y. À cette 
même fin au lieu de l'événement B nous allons considérer la variable 
n égale à 1 si B est réalisé et à O0 dans le cas contraire; on a alors 


M(E1B)=M(EIYy), y = 1. 


Il est évident que pour une valeur donnée de y l'espérance mathé- 
matique conditionnelle M (£ | y) a toutes les propriétés des espé- 
rances mathématiques établies plus haut. En particulier, 


M (GE ]y) =&k-M(E y) 
pour une constante quelconque k; de même 


M(E1 + Ë2 1y) = M (& 1y) + M (E2 ! y), 
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etc. (voir (1.4.2)-(1.4.11)). Notons plus particulièrement les proprié- 
tes suivantes : 
a) si E ne dépend pas den,ona 


M(EIYy=ME; (1.4.17) 
b) si Ë, ne dépend pas du couple de variables (£,, n), on a 
M(E: Le |y) = M (6) -M (&2 | y). (1.4.18) 


L'égalité (1.4.17) est évidente. Quant à l'égalité (1.4.18), on 
l’obtient tout comme (1.4.6), car mème sous la condition {n = y} 
les variables E, et &, restent indépendantes et leur distribution condi- 
tionnelle simultanée est 


P (Zi, Ze, y) Pe, (x1)°P (za CLIS 
— Et 82 N — £1 Ë2, n 
Pa, Gr ele pt Pr) 


= Pa (21) - Pie (xl y) 
dans le cas discret et 
Per, ge, n (te 2e, 9) Pas (ri) Pen Ge D 
Pn (y) = Pn (4) E 
= PE; (x) * Pts (Zoe |L | y) 
(dans le cas continu, la densité simultanée étant p:, :.n (Z1; Te, Y)). 


Il est évident que l'égalité (1.4.18) reste également vraie pour une 
variable vectorielle n = (n1, . - ., MA), lorsque y = (y,, . .., y,) 


Per, te (1: TLo| y) = 


Pour l’espérance mathématique totale nous allons donner la formule 
suivante analogue à (1.2.5): 


ME 2 M(EIB:)-P (Ba), 


Où Bi, B:, . . . est un système complet d'événements mutuellement 
indépendants. De même 


Mi © ME y) Pat) 


pour une variable n discrète de loi de probabilité P, (y) et 


ME — | M (& 1 y) Pn (y) dy 


pour une variable n continue de densité de probabilité p, (y) (ces 
égalités découlent directement de la définition de l'espérance mathé- 
matique conditionnelle). 

Si l’on considère la moyenne conditionnelle M (£ ji y) comme 
une fonction de la variable y et que l’on substitue à y la valeur de 
la variable aléatoire n, on obtient que M (£ | n) est une variable 


4* 
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aléatoire (qui est une fonction de n). Dans cette interprétation la 
formule de l'espérance mathématique totale devient 


M [M {& In} = ME. (1.4.19) 


Citons aussi la formule dite de l'espérance mathématique répétée *) 
généralisant l'égalité (1.4.19) au cas où la distribution initiale est 
elle-même conditionnelle, soit 


M{MEInlIt=M{EIC}, 


où la variable aléatoire & (multidimensionnelle) est une certaine 
fonction de n. 
Attirons l'attention sur l'égalité importante suivante: 


M (p (n)-E In) = p (M) -M(E In), (1.4.20) 


où œ(n) est une fonction d’une variable aléatoire n. 
En effet, pour chaque valeur donnée de y, œ (y) est une certaine 
constante telle que 


M [œ (y)-E 1 y] = p (y)-M (E I y). 


Si la variable aléatoire E est indicatrice de l'événement À, de sorte 
que 
{o lorsque l'épreuve réalise À et 


O0 dans le cas contraire, 


on a évidemment M E = P (4). L'’espérance mathématique condi- 
tionnelle d’une telle variable & pour une valeur donnée de n n’est 
rien d'autre que la probabilité conditionnelle de l'événement À, 


à savoir : 
M (& In) = P (4 In); 


quant à la relation (1.4.19) elle donne dans ce cas la formule suivante 
de la probabilité totale : 


P (4) =MIP(4 |n1)l. (1.4.21) 


Jusqu'à présent nous avons laissé de côté la question de savoir 
si l'espérance mathématique conditionnelle M (Ë | n) pour telle ou 
telle valeur de n existe. Si M (E |n) existe, ceci signifie que 
M(I£ |[[In)<o (voir le point 1, où l’on donne la définition de 
l'espérance mathématique). Or, si la valeur moyenne inconditionnelle 
finie M IE |(MIE |-<oœ) existe, la formule (1.4.20) de l’espé- 
rance mathématique totale donne la relation suivante: 


MIM(IEIINI=MIElI< 00, 
d'où il découle que M(|E | |n) << avec une probabilité 1. 


*) Pour plus de détail voir, par exemple, I. Guikhman et A. Skorokhod, 
Introduction à la théorie des processus aléatoires (en russe), Moscou, Nauka, 1965. 
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En effet, la probabilité pour que la variable aléatoire n prenne 


une valeur pour laquelle Ë = M (|E | | n) ne sera pas supérieure 
à !V est, en vertu de l’inégalité de Tchébychev, 


2 — _— MÈ MIE 
PÉ<N)=P{VESVN)>1- 1, 


ce qui donne immédiatement 


P{M(IET In) < oo}= lim P{M(IE] In)<N}=t. 


Ainsi, lorsque M | E | -< ©, on peut affirmer qu'avec une pro- 
babilité 1, pour une valeur quelconque de n, l'espérance mathématique 
M (& | n) existe. 


4. Distance quadratique moyenne et coefficient de corrélation. 
Désignons par À l’ensemble de toutes les variables aléatoires £ pour 
lesquelles M E? < oo. En vertu de l'inégalité (1.4.14), pour £:, 
E, € H quelconques, toute combinaison ë = ciË, + CeËe, en parti- 
culier la différence E, — E., appartient à A. 

Définissons la distance quadratique moyenne entre les variables 
Es 82 € H comme 


NE —E 1 = V MIE —Ef. 


Cette notion est analogue à la distance quadratique moyenne entre 
les fonctions œ, (x) et y, (x) de la variable x, a < x < b, utilisée 
en analyse fonctionnelle, et définie comme suit: 


b 
I pige ll= ( | [or (a)— po) (a dz)", 


où f (x) > 0 est une fonction donnée appelée poids; de plus, sous la 
b 


condition | f (x)dxz = 1 on a (voir la formule (1.4.9)): 


I P1 — Poe I = (M | qi (Ë) — pe (E) F)'7, 


où Ë, a S E < b, est une variable aléatoire de densité de probabili- 
té f(x), aLrz< b. 

La distance quadratique moyenne || E, — £, || montre dans une 
certaine mesure à quel point les variables correspondantes diffèrent 
l’une de l’autre; en particulier, en se basant sur l'inégalité de 
Tchébychev on peut affirmer qu'avec une probabilité au moins égale 


» 


à 1 7 E1 — £2 ||” les valeurs £,, E, diffèreront au plus de e: 


P (Bi El<e)>1— IE —Ee ff. 
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De même, comme nous l’avons déjà mentionné, la variance DE — 
=|[£ — af montre à quel point, pour les différentes issues aléa- 
toires w. la variable & (w) s’écarte de sa valeur moyenne a — M E;: 
pour une constante quelconque c, on a 


MŒ—c) = MIE —a) +(a— co) — 
=M(E—- a) +2(a—c)-M(E — a) + (a — c)° — 
=M(E—- a" +(a— cu) > M (6 — a) = DE, 


de telle sorte que la valeur moyenne a -: M E est la constante dont 
la variable aléatoire E s’écarte le moins, c’est-à-dire que 


min ||E—co|| =||È—a||. (1.4.22) 
Co 


Soient les variables aléatoires Ë, et &.. Proposons-nous de trouver 
une combinaison du type c, + c.Ë. (où c, et c, sont des constantes) 
donnant la meilleure approximation pour la variable aléatoire E, 
en ce sens que: 

M (E1 — C1 — cab)? = min M(&i—ci—cob2) (1.4.23) 
Ci, C2 
(le minimum est pris sur toutes les constantes c, et c.). 
Posons 


r = MG) Gras) (1.4.24) 
OO 


a =ME, 0 = DE et a = ME. o: = DE. 


Pour faciliter les calculs, passons aux variables aléatoires normées 


_— a — la 
qu = et mie. 


Pour des constantes c;, et c. quelconques on a 
Mm—a—cne) = Mim—-m)-a+(tr—-c)nlf - 
= Ar) ++ (r— ca). 


On voit que le minimum de l’expression M (n, — c, — c2n,)° cor- 
respond à =0etc;, =r: 


min M (mM—c—cene) =flm—melt=1—17. (1.425) 


Ci, C2 


En exprimant la différence n, — rn, en fonction des variables ini- 
tiales E, et E., on obtient 


i _ 
"1 me [&h-a—r re (Es — ae) | ’ 
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ainsi que la combinaison linéaire cherchée dans (1.4.23) est évidem- 
ment 


Ci + CoËe = +7 (Es — 03). (1.4.26) 


a, et a, sont ici les espérances mathématiques des variables aléatoires 
ë, et +, 0° et 05 leurs variances ; la constante r définie par (1.4.24) 
est appelée coefficient de corrélation de ces variables aléatoires et 
se trouve étre une caractéristique simple de liaison existant entre 
elles. 


Comme on peut le voir à partir de la formule (1.4.25), on a toujours 
pour le coefficient de corrélation —1 << r < +1; de plus, si r = 
— —1 ou r = 1, la variable aléatoire E, est simplement une combi- 
naison linéaire de la forme Ë, = ©, + Cabo. 

En effet, si r = —1 ou r — 1, en vertu de la formule (1. 4,25) 


la valeur quadratique moyenne de la grandeur Ë, — c, — ct, est 


Mi — à — cb) = 0 4 — r°) = 0 


et par conséquent Ë, — ©, — c.. — 0 avec la probabilité 1. 
Si les variables aléatoires &, et &, sont indépendantes, 
leur coefficient de corrélation est égal à zéro, car 


M (£ — @) (Es — de) = M (61 — &)-M (&: — a) = 0. 


Il faut remarquer que la condition r = 0 n’entraîne pas en général 
l'indépendance des variables aléatoires E, et E.. 

Soit par exemple Ë, une variable aléatoire à répartition symétri- 
que de densité de probabilité p, (x) telle que p (—zx) = p (x), 
—00 <T TL oo; posons Ë: = |E, |. Bien que la variable E, soit 
une fonction de E.,. le coefficient de corrélation des variables E, 
et £, sera égal à zéro, car 


© 


m=ME= | xp (x) dr =0 


— 0 


et comme il est facile de le voir 


O0 


M Œi— a) sas) = Mb) = | 2121 px (2) d2 —0. 


— 00 
Considérons le problème général de la meilleure approximation 
n 


de la variable aléatoire E, par des combinaisons linéaires Ÿ ChËk 


d'autres variables aléatoires E,, ..., &,. Il s’agit de trouver 
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à partir des caractéristiques données 
an =ME,, où —M (E:— a), 
M (Ex — an) (Ej— aj) (k, j=0, 1 


— A 
Thj 0x0} n} 


les coefficients Co, Cn + --, Ch tels que 
n n 
I 80 —(co+ À cxbx)]= min |Eo—(co+ D cubx)|]. (1.4.27) 
k=1 Co. .,Ccn Rk=—1 


La relation générale (1.4.22) obtenue précédemment montre 
que si les coefficients correspondants c,, ..., ©, sont connus, la 
constante © doit être choisie comme suit: 

[n n 
Co= M (Eo — D CaËx) = do— D Crax 
k=1 R=i 
Sans restreindre la généralité, on peut poser &, = 0, k = 0, 1, 
... N; on a alors © = (. 


Considérons ainsi les variables aléatoires &E,, Ex, . .., E, de 
valeurs moyennes nulles et de matrice de corrélation {R;,;} d’ éléments 


Riy = MBnËy (Ran = GC; Raj = Onray0s) (k, j=0, 1,..., n). 
(14.28) 


‘ La matrice de corrélation {R,;} est définie positive ; en effet, pour 
Co Ci»---1 Cn réels quelconques, on a 


, à ) ChCjRr3 =M (2 tx) >0. (1.4.29) 
, = = 


En utilisant cette matrice on peut dans l’espace linéaire H de 
toutes les variables aléatoires du type 


E= D crbx (1.4.30) 
k=—0 


introduire le produit scalaire que l’on définit pour £” = > cit 


ñn 


et E” — © ciEx quelconques comme suit : 


n 


EE) MET= D  RCRas- (1.4.31) 


La distance quadratique moyenne introduite ci-dessus est une distan- 
ce dans l’espace euclidien A de produit scalaire (1.4.31), à savoir 


IE EVE —E", EE). 
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Dans l’espace euclidien À il existe une grandeur 
ñn 
Eo — 2 ChE; 


Rk— 
satisfaisant à la condition (1.4.27) 
LL 
lËo—Éol= min {|Eo— Ÿ cata: 
Ct, --.., cn k=1 
du point de vue géométrique c’est la projection de l'élément £, € H 
ñn 
sur le sous-espace de tous les éléments du type D c.ëz. 
k=1 
On peut trouver £, à partir de la condition d’orthogonalité de la 
différence £, — E, par rapport à tous les E,, k — 1, ..., n. ce qui 
donne le système suivant d'équations linéaires pour les coefficients 
Ch k = À, sn: 


Go 2 ChËR E;)=0, j=1, c..) MN, 
ou plus en détail 


à Rajcx = Ro, j=1,...,n. (1.4.32) 


(On a tout intérêt évidemment d'envisager le cas de variables 
linéairement indépendantes E,,...,E, pour les- 
quelles le déterminant du système (1.4.32) est différent de zéro.) 


9. Théorèmes de convergence. Considérons la suite de variables 
aléatoires E,, r — 1, 2, .... On dit que la variable aléatoire E 
est la limite en moyenne quadratique de la suite £,, ce qu’on note comme 
suit : 

Jim m.q. En — E, 


ñn+0 
si [Er —E || = VMIÈ— EF +0 pour no. 
Pour une suite convergeant en moyenne quadratique Ë,, n = 


— 1, 2, ..., en vertu de l'inégalité de Tchébychev on a également 
une convergence en probabilité, à savoir 


P{lEn—E]l>e}<— [En —EfP->0 pour n—00, 


c'est-à-dire si petits que soient & >> 0 et Ô >> 0, pour z suffisamment 
grand, la probabilité de chaque événement {[E, — £| > e} sera 
inférieure à Ô. Ainsi, si en considérant la variable aléatoire £, on 
néglige l'événement peu probable 4, = {|E, — E| > e}, on aura 
En & E à e près. 
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Rappelons que nous étudions des variables aléatoires E, — £, (w), 
n — 1, 2, ..., dépendant de l'issue élémentaire «© € Q. Suivant 
l'issue élémentaire w, on obtient une suite correspondante de nom- 
bres E, (w), n — 1, 2, ..., appelée échantillon. 

Fixons une certaine valeur de &. Comme nousl’avons déjà men- 
tionné, pour une suite convergeant en moyenne quadratique E,, 
n = 1, 2, ..., chaque événement 4, = Q@ pour lequel JE, (w) — 
— E(w)| > e est peu probable pour nr grand (P (4,) — 0 pour 
n — ©). Cependant il peut arriver que dans la suite 4,, n — 1, 2,..., 
il se produise un nombre infini d'événements, c’est-à-dire que l’on 
aura dans la suite échantillon E, (w), rz — 1, 2, ..., un nombre 
infini de termes (que nous désignerons par Ë&,, (w)) tels que 


En, (&) — E(w)|>e, par conséquent la suite E, (w), nr — 


= 4; 2, ..., ne tend pas vers la valeur E(w) de la limite &. Con- 
sidérons un exemple simple d’une suite de variables aléatoires E,, 
n ==1, 2, ..., convergeant en moyenne quadratique, 


pour lesquelles la suite échantillon E, (w), nr = 1, 2, ..., ne conver- 
ge pour aucune des issues élémentaires o. 


Exemple. Supposons que l’espace des issues élémentaires 
w soit constitué par le segment 0 < w < 1 de répartition uniforme 
et que la suite &,, r = 1, 2, ..., se compose de variables aléatoires 
Emk = Emx (©) du type 


. k—1 k 
[1 Si —<o<—, 
Ema (©) = 7e 
(O pour les autres w, 
où À — 1, 2, ..., m, m — 1, 2, .... La suiteE,, n — 1, 2, .., 
converge en moyenne quadratique vers zéro, car M Ex — + 0 


pour »m—+ oo. Mais pour toute issue élémentaire w on a un nombre in- 
._ NT k—1 k 
fini de valeurs E,x (w) aux indices m, k: —— << <—; tels que 


Emn =1. Donc, pour aucune desissues élémentaires la suite échantillon 
Er (w), n = 1, 2, ..., ne converge vers zéro. 


On dit que la suite de variables aléatoires E,, n = 1, 2, . .., 
converge avec la probabilité 1 vers la variable aléatoire £ si pour la suite 


échantillon E, (w), nr — 1, 2,..., on a 
lim Eh (0) := E (w) (1.4.33) 


pour toutes les issues élémentaires w, à l’exception peut-être de cer- 
taines issues de probabilité globale 0, c’est-à-dire si la relation limite 
(1.4.33) est un événement de probabilité 1. 

La convergence Ë, (w)—E (w) signifie que [E, (&)— E (o)| < € 
pour € >> O quelconque pour tous les » suffisamment grands, autre- 
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ment dit |E, (&) — & (w)| > € pour un nombre fini de termes au 
plus de la suite E, (w), nr = 1, 2, ... . Ainsi, si E, (wo) — E (w) 
avec la probabilité 1, pour € >> 0 quelconque avec ia probabilité 1 
il ne peut se produire qu’un nombre fini d'événements A® = {|E, (wo) — 
— E(w)]>e}, nr = 1, 

Nous allons montrer que cette condition est suffisante pour que 
E, (o) — E (w) pour rñn — co avec la probabilité 1. Posons € — 1/4 
et désignons par B}, l'événement correspondant à ce que dans la s suite 


A, n = 1, 2,..., il n'y a qu'un nombre fini d'événements AE — 
= {IE (o) — E(&|>+}, » 1, 2, .... De toute évidence, les 
By, k = 1, 2, ..., forment une suite monotone décroissante B, = 


Z B, = ..., alors pour l'événement B = fN\ B, en vertu de la 
k 
propriété de continuité de la probabilité on a P (B) = lim P (B,); 


R — 00 
pour P (B,) = 1 on a P (B) = 1; il est clair que ËE, (w) — E (w) 
pour z— © pour une issue élémentaire quelconque w € B. 


Lemme (de Borel-Cantelli). Soit À,, n = 1, 2, ..., une suite 
d'événements quelconques A, de probabilité P (A,) = p,. Si 


148 


Pa < ©, (1.4.34) 


avec la probabilité À il ne se produil qu'un nombre fini d'événements 
de ce type. 


Démonstration. Désignons par B l'événement corres- 
pondant\ à un nombre fini d'événements parmi À,, n = 4, 2, ., 
et par B, l'événement signifiant qu’au moins un des événements 
A, k>n  (B, = = U A) a lieu. I] est évident que l’événement B appa- 


raît si et seulement si tous les événements B,, n = 1, 2, ..., sont 
réalisés (B = fN B,). Comme B,=B,= ..., on a | P(8) = 
n 


= lim P (B,). La probabilité d’une réunion d'événements quelcon- 


71 — 0 
ques ne dépasse jamais la somme de leurs probabilités, de telle sorte 
que 


Les © 


P (Br) < < à P P (4:) = = 2 Ph; 


hk=—n n 
CO 


où d’après la condition (1.4.34) > px > 0 pour nr —+ oo. Par consé- 
h=n | 


quent 


P (B)=lim P (Ba) = 0 
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tandis que B,complémentaire de B et signifiant que dans la suite 
A;, A 9 .., il n'y a qu'un nombre fini d'événements, a la probabi- 
lité P (B) = 

Théorème 1. Si une suite de variables aléatoires £,,n = 1,2, 


converge en moyenne quadratique vers la variable aléatoire E « suffisam- 
ment rapidement », à savoir si 


> Îl En — El << CO; 
R=—1 


cette suite est convergente avec la probabilité 1. 


Démonstration. Pour e>0 quelconque, d'après 
l'inégalité de Tchébychev pour l'événement 4, = {JE, (0) — 
— E(w)[>e} on a P (4,) < || E, — Ell/e* et par conséquent 


D P(An<Z+ D IEEE < oo. 
n=— n=1 


En vertu du lemme de Borel-Cantelli, seul un nombre fini d'événe- 


ments ÀA,, n = 1, 2, ..., se trouve réalisé avec la probabilité 
1, et ceci signifie, comme nous l’avons déjà noté, que lim E,, (w) = 
71— 00 


— & (w) avec la probabilité 1. 


La distance quadratique moyenne || E, — E.|| = V MIE, — E./f, 
comme il se doit pour une distance réelle entre des points (de l’espace 
H, voir le point 4 précédent), satisfait à l'inégalité triangulaire 
disant que pour trois points quelconques E, n, ÊEH la distance entre 
E, n n’est pas supérieure à la somme des distancesentre E, & et n, C: 


TE—ni<IE— GUN + ln — SI. (1.4.35) 


Ceci découle directement de l’inégalité générale (1.4.14) appliquée 
aux différences Ë, = ë — Let E, = n — &. 
On a la proposition suivante. 


Théorème 2. Pour qu'une suite de variables aléatoires E,, n = 


= 1, 2, de H converge en moyenne quadratique vers une certaine 
variable aléatoire E € H il faut et il suffit que 
lim ||Ën —Em || = 0. (1.4.36) 


La nécessité de la condition (1.4.36) découle de l’iné- 
galité triangulaire: lorsque la suite E,, n — 1, 2, ..., converge 
en moyenne quadratique vers la grandeur £, on a 


Il En — Emll < | En — El + || Em — Ell— 0 pour 7, Mm—> oo. 
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La démonstration de l'existence, sous la condition (1.4.36), d'une 

variable E € H telle que £ = lim E, exigeant le recours à un appareil 
1 — 00 

mathématique spécial (théorie de la mesure), nous omettrons cette 

démonstration *). 


Considérons la suite £,, nr — À, 2, ..., convergeant en moyenne 
quadratique vers la variable aléatoire £. Les variables E, € ÆH ont 
des espérances mathématiques finies ME,, car en vertu de l'inégalité 


(1.4.13) MIE, | & VME << oo. Montrons que 
lim ME, — ME. (1.4.37) 


n— 00 


En effet, comme nous l'avons déjà noté, la variable ÈE FH possède 
une espérance mathématique finie ME et 
IME, — ME MIE, — El < VMIE— EF — 0 
pour n—+ oo. 


Soit fn, À = 1, 2, ..., une autre suite convergeant en moyenne 
quadratique (vers la variable aléatoire n). 


Théorème 3. On a La relation limite suivante: 


lim MEnna = MEn. (1.4.38) 


T— 0 


Démonstration. Pour des grandeurs quelconques E, 
n € À on a l'espérance mathématique finie MEn, car en vertu de l’iné- 


galité de (Cauchy-Bouniakovski MlJën| < VMIEË -V Mmi. De 
plus, les valeurs quadratiques moyennes ||E,]| = V ME: et [In,|| = 
— Y Mn sont bornées par une certaine constante : 

Îl En I SI E TN HIEn — EC, 

na H< nil +inn —ni<cC, 
car || Eh — El —- 0, [na — nll—- 0 pour nr—+ ©. En utilisant de 
nouveau l'inégalité de Cauchy-Bouniakovski on obtient 
IMEnn — Mn! < IMéann — Man] + IMEon — MEn| < 

<M (Bal: mn — 11) +M (nl: ln — 61) 
< 1 nl nn — nÙ + [nil NEn — EN EC (ER — EI + Inn — 


— n]l) — 0 
pour 7 —+ oo, ce qu'il y avait lieu de démontrer. 


*) Voir, par exemple, l'ouvrage cité de I. Guikhman, A. Skorokhod (pa- 
ge 108). Notons que nous utilisons le théorème 2 seulement lors de la définition 
les intégrales dites stochastiques (voir pages 196,216, 225 du présent ouvrage). 


62 NOTIONS FONDAMENTALES DE LA THÉORIE DES PROBABILITÉES [CH. CL 


Nous allons donner sans démonstration *) deux autres théore- 
mes sur la convergence des espérances mathématiques. 

Soit E, & Es KL... une suite monotone croissante de variables 
aléatoires non négatives. Pour chaque issue élémentaire w la suite 
échantillon monotone croissante E, (w), r = 1, 2, ..., a une limi- 
te finie ou infinie E (w) > 0. Supposons que les variables E, aient 
des espérances mathématiques ME,, nr = 1, 2, ..., finies. Cette 
suite monotone croissante a une limite finie ou infinie lim ME. 

Ji — O0 

Théorème 4. Si la suite ME,, nr = 1, 2, ..., est bornée, la varia- 

ble aléatoire limite E—]lim E, est finie avec la probabilité 1 et 


> 


lim ME: — ME. 


n— 00 


Ce théorème a pour conséquence le résultat suivant: 
Soit une suite de variables aléatoires non négatives E,, k—1,2,..., 
CO 


telle que la suite des espérances mathématiques Ÿ} ME, est convergente. 
k=1 


Avec la probabilité 1 on a alors 


> Ex << 00 
et 
M(D &)= > ME. (1.4.39) 
R=1 Rk=—! 


En effet, les sommes partielles ÿ Er, R = 1, 2, ..., forment 
h=— 


= 1 
une suite monotone croissante pour laquelle les espérances matheé- 
n 


n 
matiques M (9 E:) = D MEx, n = 1, 2, .... sont bornées: 
k=1 = 


MS E£,) & D ME: < co, et en vertu du théorème 4 avec la proba- 
k=1 k=1 
bilité 1 il existe la limite finie lim 2 En = À Ex, de plus 
n n n 
Mllim SN &]=limM [2 E,]—=lim > ME. 
Î —= n +00 


n—-0o kÀ— n— 00 Rk=1 


*) Voir l'ouvrage cité de 1. Guikhman et A. Skorokhod (page 102). Le 
théorème 4 ci-dessous (plus exactement la conséquence (1.4.39)) n'est utilisé 
ue dans la démonstration aux pages 183 et 225 et le théorème 5, aux pages 


145 et 1959. 
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Théorème 5. Soit une suite de variables aléatoires £,, n = 1, 2, . 

., convergeant avec la probabilité 1 vers une certaine grandeur Ë, 
|E,| <n, où la variable aléatoire n possède une espérance mathé- 
matique finie (M |n | << oo). Les variables E, et E ont également des 
espérances mathématiques, de plus on a 


n — 00 


$ 9. Séries illimitées d’essais indépendants 
et lois des grands nombres 
1. Loi des grands nombres. Considérons une suite de variables 
aléatoires indépendantes 
Es Eos +. (1.5.1) 


ayant mème distribution (on peut imaginer qu’on effectue une série 

d'essais indépendants identiques Q,, Q,, . .., dans chaque essai 

Q, on observe la variable correspondante E,, n = 1, 2, ...). 
Supposons que l’espérance mathématique et la variance 


a =ME,, 0° — DE, n =1,2,..., 
existent ; considérons la valeur moyenne « empirique » 


n 


_ S 
LHE-T (1.5.2) 
= Î 


(que l’« observateur » peut calculer à partir des résultats des essais 
n 


Q,,..., Q,). Pour la somme S, = à t,ona 


k=1 
MS D Mia, 
k=1 
Sn sal Sn 241 Some 9 
DE-M(=E—c) Ta 2 Dé = 
(ES | 

On voit que 

_ > E—a|= 7 —+0 pour n—+ 0, (1.5.3) 

k=1 


n 
SJ . 1 
c'est-à-dire que la moyenne empirique — > Ex converge en moyenne 


k=1 
quadratique vers l'espérance mathématique a: 


Jim m.q. + D'Erx=a. 


ñn— 0 h=1 
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Ainsi, pour e& >> 0 quelconque, la probabilité pour que la moyenne 
n 
._. 1 . se ’ - 
empirique — D En, pour n suffisamment grand, diffère de l'espérance 


hk=1 
mathématique a d'au plus e, est voisine de 1, plus exactement 
P{ 


pour Ô >> 0 aussi petit que l’on veut et n suffisamment grand; dans ce 


1H age) >1—8 
R=1 


cas l'inégalité de Tchébychev donne l'estimation suivante de la probabi- 
lité mentionnée : 


P{ 


En réalité on néglige toujours la possibilité de réalisation des évé- 
nements dont la probabilité est suffisamment petite. Si l’on néglige 
LU 


+ Dh-alge}>1-7. (1.5.4) 
k=1 


l'éventualité de l'événement peu probable E D Er — e|> e 
k=1 
(de probabilité non supérieure à un Ôô assez petit), on peut considé- 
2 
rer que pour z donné suffisamment grand (par exemple nr > 5) 


on a 
n 
1 
a—E<— D'En<ate, 
k=1 
n n 
c'est-à-dire qu'à e près, la moyenne empirique — » Ex coïncide avec 
. k=1 
la valeur moyenne a, soit: 


L SE. (4.5.5) 


k 


Î 
— 


Cette loi remarquable, exprimée par les relations (1.5.3), (1.5.4), 
porte le nom de Loi des grands nombres. 

La loi des grands nombres mentionnée a été démontrée non seule- 
ment pour des variables aléatoires indépendantes, mais aussi pour des 
variables non corrélées E,, k — 1, 2, ... (ME, = a, DE, — 
— 0?). Pour de telles variables on peut également obtenir le résultat 
suivant. 
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Théorème (loi forte des grands nombres). Avec la probabilité 1 
on a 


1 » Ex—>a pour nr —+ 00. (1.5.6) 


k=1 
Démonstration *). Sans restreindre la généralité on peut 


supposer que a = 0. D’après l'inégalité de Tchébychev, pour e > 0 
quelconque, on a 


m°0? o® À 
>< .—— 
de telle sorte que 

3 P{|< 


en vertu du lemme de Borel-Cantelli, avec la probabilité 1, il ne peut 


>e}< <F > 7, < 0; 


S n° 
se produire qu'un nombre fini d'événements 5 4m re) > 7 , 
m = 1, 2,..., donc avec la probabilité 
Puis, soit 
Nn = max [Emme + + En. 
m+1£<hk<(mMm+ 1) 
Evidemment 
(m+1)° , 
Nm Em2 T--- T En 
p{ll>ee > PE )>e}< 
k=m°+i 
Aix (k )O 2 4 1 
e— m°) 0? 2m0o* 0° 
< D me SM me er me 
k=m°+i1 
et 
ni { 
n 
m= { | 


par conséquent, avec la probabilité 1 il ne peut se produire qu'un 
nombre fini d'événements B,, = {2|> e} .m=—=1,2,..., donc 


avec la probabilité 1 ? > O0 (pour m—+> co). Finalement, pour nr 


*) La démonstration qui vient est due à Y. Prokhorov. 
5—0521 
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quelconque, rm £< nr L(m +1)*,ona 


Sn Sn Nm 
|<| + ]+22 0 


avec la probabilité 1 pour 7 — co, ce qu'il fallait démontrer. 
On a également le résultat fondamental suivant *). 
Loi forte des grands nombres. Pour une suite de variables aléatoires 


indépendantes E,, E», ..., de même distribution, ayant une espérance 
mathématique finie a, avec la probabilité 1 on a 
- { _ 
lim D'Eu=a. (1.5.7) 
k=1 


2. Probabilité et fréquence. Considérons un événement quel- 
conque À lié à une certaine expérience. Supposons que l’on puisse 
reproduire cette expérience un grand nombre de fois et de telle sorte 
que les différents essais Q,, Q,,° .. soient indépendants. 

Introduisons les variables aléatoires E;, Ë., . .., où chaque va- 
riable E, est liée seulement à l’expérience correspondante Q, et est 
définie comme suit: E, — 1 si la k-ième expérience réalise l’événe- 
ment À et E, — 0 dans le cas contraire. On a ainsi 


MEz = p, DE: = p (1 — p), 


où p — P (4) est la probabilité de l’événement À dans chacune des 


expériences. 
La moyenne empirique 


n 
1 n (4) 
2 re 
k=1 
est la fréquence de l'événement A dans les expériences envisagées, défi- 


nie comme le quotient du nombre r (4) des expériences ayant réalisé 
cet événement par le nombre total d'expériences 7. En vertu de la 


loi des grands nombres on a 


a. P (4) pour n7—+ 00, (1.5.8) 


de telle sorte que dans une grande série d'expériences indépendantes la 
fréquence RQ) y réalisation de l'événement À coïncide pratiquement avec 


n 
la probabilité de cet événement : 
1 SP (4). (1.5.9) 


*) Voir, par exemple, W. Feller, An introduction to probability theory and 
its applications, vol. 1. John Wiley, New York, 1957. Les variables &1, Es, . .. 
ci-dessous ne sont pas censées avoir forcément une variance finie 0°. 
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Cette loi (confirmée par un grand nombre d'observations prati- 
ques accumulées) nous permet, dans les applications, d'estimer à base 
des expériences la probabilité P (4) de l'événement À comme 


P (4) = 2 (voir, par exemple, $1Â, p.4 de ce chapitre). 


Sur la table 1 ci-dessous (empruntée à l’ouvrage précité de Feller) 
sont consignés les résultats de 100 séries de 100 expériences consistant 
à lancer en l'air une pièce de monnaie. On voit que dans chaque série 


d'expériences la fréquence 4 de l'apparition de face (événement À) 
coïncide avec une grande précision avec la probabilité P (4) = !/.. 


Table 1 


Nombre 
Séries 
d'expériences Nombre de faces ile 


0—1 000 Ë Ë ). 901 
—2 000 485 
—3 000 5 i 909 
—4 000 : i 936 


—5 000 
—6 000 < 488 
— 7 000 
—8 000 
—9 000 
—10 000 


5% 


CHAPITRE Il 


LOIS DE PROBABILITÉ 


$ 1. Echantillonnage et répartition aléatoires 


1. Formules combinatoires. Les formules combinatoires sont très 
utiles pour le calcul des probabilités. Nous allons donner les plus 
importantes d’entre elles. 

Combinaisons des éléments pris dans des groupes différents. Soient r 
groupes différents composés d'éléments quelconques. Supposons que 
le premier groupe contient nr, éléments &,, @, ..., 4n,: le second, ñn, 
éléments bi, b:, . . ., b,. et le r-ième groupe, n, éléments c;, ©, . .. 

+ Cn. On forme toutes les combinaisons possibles de r éléments 
appartenant à des groupes différents, en choisissant dans un groupe 
un seul élément. Ces combinaisons sont de la forme 


(a, b, ..., c). 


Les combinaisons (a, b, ..., c) et (a. b, ..., c) sont considérées 
comme différentes si on y trouve au moins un couple d'éléments diffé- 


rents: aet a, bet b, .. ., cet c. Le nombre total de ces combinaisons 
est 


N = lot ce “y. (2.1.1) 


Pour r = 2 la formule (2.1.1) est évidente, pour r quelconque elle 
peut facilement être établie par récurrence. 

Tirage avec remise. Soient nr objets différents a, &, ..., a 
De cet ensemble on tire un à un r objets, en enregistrant chacun des 
objets tirés et en le remettant ‘en place. Le résultat de ce tirage est 
une combinaison de la forme 


(ai, Ass = + ai). 


Les combinaisons (ai, » Bis + Gi) et (a,, Aj,s ++. Aj) Sont 
considérées comme différentes si elles diffèrent par au moins un élé- 
ment, c'est-à-dire si ai, 5 aj, pour au moins un *. On peut imaginer 
que l’on a r groupes identiques de x éléments et que le k-ième tirage 
s'effectue dans le k-ième groupe. Dans ce cas particulier la formule 
(2.1.1) donne l’expression suivante pour un nombre W de combinai- 
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sons différentes: 
N=n. (2.1.2) 


Nombre d'arrangements. Tirage sans remise (tirage exhaustif). 
Soient r objets différents à loger dans nr cases différentes. L'’obser- 
vateur possède un moyen de distinguer les cases les unes des 
autres. Supposons qu’on loge dans chaque case au plus un objet. 
Numérotons tous les objets et les cases. Chaque arrangement peut 
alors ètre décrit par une combinaison de la forme (&, i2, ...,i,), 
où i, est le numéro de la case donnée au 1° objet; à, celui de la 
case du 2° objet. etc.; i,, le numéro de la case où l'on loge le 
dernier, r-ième objet. Dans la combinaison (ii, is, ...,i,) l’élé- 
ment i; peut être l’un quelconque des n éléments (cases); à, l’un 
des n—1 éléments restants, etc.; à; peut être l’un des n—r+1 
éléments possibles. Conformément à la formule générale (2.1.1). on 
a en tout 


N=n(n—1)...(n—r+1) (2.1.3) 


répartitions différentes de r objets dans n cases. 

Soit un ensemble de n éléments différents a,, &, ..., a&,, dans 
lequel on prend r éléments. On peut supposer qu'ils sont tirés simul- 
tanément et disposés dans un certain ordre, ou bien que les éléments 
sont tirés l’un après l’autre, l’objet tiré n'étant pas remis en place. 
On obtient ainsi une combinaison (a;, Gin se a), où a, est le 
premier des éléments tirés, a, le second, etc., ai. le dernier; ai, 
peut être l’un quelconque des 7 éléments dont on dispose, a;, l'un 
quelconque des rz — 1 éléments restants, etc., Qi, l'un desn — r + 1 
éléments possibles. En tout on a 


N=n(n—1)...{(n—r+1) 


échantillons différents (a;, a;,, ..., a; ) de r objets, choisis sans 
remise en place dans un ensemble de » objets. 


Pour r = n le nombre d’arrangements coïncide avec celui de 
permutations de n éléments: 


N=n(n—1)...1=n! (2.1.4) 


Norabre de combinaisons. Supposons que l’on dispose dans n cases 
r objets indiscernables (chaque case ne pouvant recevoir plus d’un 
objet). Le nombre d’arrangements discernables coïncide alors avec 
le nombre de groupes différents de r cases que l’on peut former à 
partir d’un ensemble de taille nr (toutes les cases occupées sont réu- 


nies dans un même groupe) et est celui de combinaisons C7 de n élé- 
ments r à r, soit: 


N=c-"!t (2.1.5) 


ri(n—r)!" 
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En généralisant le problème, on peut se proposer de répartir n élé- 
ments en X groupes, en fixant aussi bien le nombre de groupes que 
celui des éléments dans chaque groupe ; par exemple, on peut deman- 
der de réunir dans le groupe numéro à nr; éléments. À part cela les 
éléments sont groupés d’une manière quelconque. Le nombre de com- 
binaisons différentes de nr éléments n, à 4. le à No, . . ., lp à Np, lOrS- 
que M + ... +n, = n est égal à: 


n! 
 nmlnel...ng! 


(2.1.6) 


La formule (2.1.5) peut être obtenue de la manière suivante. 
Supposons pour le moment que les objets étudiés soient tous diffé- 
rents; le nombre d’arrangements différents (voir (2.1.3)) sera alors 
égal à r (nr — 1) ... (n —r + 1). Pour un groupe quelconque ë,, ... 

., t de Cases occupées ce nombre contient également les arrange- 
ments obtenus par permutation de r éléments dans les cases occupées ; 
le nombre total de ces permutations est égal à r!. Par conséquent, le 
nombre de combinaisons nous intéressant C; de n cases r à rest in- 


férieur de r! fois au nombre d'’arrangements indiqué 7 (nr — 1) ... 
... (n—r+1), soit 


çr="@zt (rt) | nl. 
a. — r| _ rt(n—-n!° 


Pour démontrer la formule (2.1.6), écrivons-la sous la forme sui- 

vante : 
A a Rp _ 
N = Cn'Cn°n, ... Can. Nip _o° 

On peut former les groupes de n,, n:, .... n, éléments successi- 
vement. On commence par former un groupe de nr, éléments (ce 
que l’on peut faire de V, = C1 manières différentes); puis à partir 
des 7 — n, éléments restants on forme un groupe de n, éléments (ce 
que l’on peut faire de W, = Crn, manières différentes), etc. ; les 
R—M—... — Ne = + Ar éléments restants en fin de 
compte peuvent être répartis en deux groupes de n,-, et nr; éléments 
de Vin = Cri _ ... -n,_ manières différentes. En combinant 
à chaque étape les méthodes de formation des groupes, conformé- 
ment à la formule générale (2.1.1) on obtient finalement le nombre 


mentionné V = NN, ... N,_, de toutes les combinaisons possi- 
bles. 


Dans toutes les égalités établies ci-dessus on trouve l’expression 
nl! =1.2... (nr — 1) nr approximable par la formule de Stirling *) 


nl V 2n1nn'e", (2.1.7) 


*) Voir, par exemple, l'ouvrage déjà cité de W. Feller. 
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où e = 2,718 ... est la base des logarithmes naturels (ici et ci- 


dessous la relation «, — B, entre les variables a, et B, signifie que 


[e 4 . . . . 
— — 4 pour n —+ œæ). Une meilleure approximation de n! vraie pour 


Ba 
tous les rz = 1, 2, ... est donnée par 
i i 
nt gt Lei 
2nn n'en 

Exemple. Un groupe de r voyageurs monte dans un train de 
banlieue ayant nr >r wagons. Supposons que chaque voyageur 
choisisse son wagon au hasard et puisse se trouver avec la même 
probabilité dans l’un quelconque des wagons. Quelle est la probabi- 
lité pour que tous les voyageurs se trouvent dans un même wagon? 
dans des wagons différents ? 

Chaque voyageur peut choisir l’un des r wagons, alors le nombre 
de différentes combinaisons (i, ë:, . .., à), où i, est le numéro 
du wagon choisi par le k-ième voyageur, est égal à N = n°. L'événe- 
ment À «tous les r passagers se trouvent dans un même wagon» 
a licu pour l’un quelconque des V (4) = n issues pour lesquelles 
li = lo = ... =, Sa probabilité est 

N (A 
PH= = 
L'événement B : « dans aucun wagon ne monte plus d'un voyageur 
du groupe envisagé » apparaît dans le cas et seulement dans le cas où 
tous les éléments ë,, k = 1, .... r, sont différents. On peut consi- 
dérer qu’il y a ici un tirage exhaustif de r éléments dans un ensemble 
de taille nr, à savoir, le premier voyageur choisit l’un quelconque des 
n wagons, le second l’un quelconque des (7 — 1) wagons restants, etc. 
Par conséquent. le nombre de combinaisons (i,, ë, . . ., à.) donnant 
lieu à l'apparition de l'événement B est égal à n (n — 1) ... 
... (nm —r + 1)et la probabilité de cet événement est 
P (B) _n (nr —1) = (TE | 

Exemple. Supposons que des n clefs une seulement ouvre 
une porte. On essaie les clefs une à une. Trouver la probabilité de tom- 
ber sur la bonne clef lors du k-ième essai. 

On suppose que les clefs sont disposées au hasard (ë,, &, . . ., in), 
toutes leurs répartitions étant équiprobables. Attribuons à la bonne 
clef le numéro i. La probabilité cherchée est alors égale à la probabi- 
lité que dans un ensemble non ordonné des nombres 1, ..., n le 
nombre à se trouve à la k-ième place. Le nombre total de répartitions 


(i. . . .… in) est égal à nr! et le nombre de répartitions avec l’élément 
i — à fixé est égal à (7 — 1)!, donc la probabilité cherchée est 
(n—1)! 1 


n | n° 


=) 
tp 
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Exemple. Considérons le jeu de préférence. On distribue les 
32 cartes supérieures d’un jeu entre trois joueurs recevant chacun 
10 cartes, deux cartes restantes constituent le talon que reçoit le 
joueur annonçant alors son jeu. Supposons qu'avec la rentrée il 
ait cinq cartes supérieures d’une couleur (par exemple de cœur) 
à l'exception de la dame. En annonçant le jeu, il faut tenir compte de 
l'éventualité que l’un des partenaires ait les trois autres cartes de 
cœur, y compris la dame. Trouver la probabilité de cet événement. 


90! 
Ilyaen tout C — Li répartitions équiprobables de 20 car- 


tes en deux groupes de 10 cartes données à chacun des deux joueurs. 
En fixant la combinaison de trois cœurs avec la dame chez l’un des 
joueurs, on trouve que le nombre de répartitions différentes des cartes 
17! 
1110! 
des 17 cartes restantes 7 à 7 (ou ce qui est la même chose de 17 cartes 
40 à 10). Par conséquent, la probabilité qu'un joueur déterminé 
ait la combinaison de trois cœurs, y compris la dame, est 


entre les deux joueurs est égal au nombre de combinaisons C*, — 


et la probabilité que l’un ou l’autre joueur ait trois cœurs est double, 
soit /19. 


2. Distributions des particules indépendantes dans l’espace des 
phases. Considérons le modèle simple suivant. On prépare une pâte 
au beurre en y ajoutant du raisin sec. Le tout est énergiquement ma- 
laxé de telle sorte que les raisins — « particules » — se trouvent 
répartis au hasard à l’intérieur de l’« espace des phases » que repré- 
sente la pâte. 

Supposons notre espace des phases de volume V (pâte) divisé 
en n 4 cases » identiques, suffisamment grandes par rapport au volu- 
me total v des particules (grains de raisin): 


L5v. 


Trouver la distribution des particules. 

Il paraît vraisemblable qu'après le pétrissage énergique de la 
pâte toutes les distributions possibles de grains de raisin par les 
« cases » soient équiprobables. Nous allons supposer qu'il en est 
réellement ainsi. Si r est le nombre total de raisins. chaque distribu- 
tion peut être décrite par la combinaison (ë,, . ... ë,), i, désignant 
le numéro de la « case » où tombe le i-ieme raisin. Chacun des r 
indices de l’ensemble ài,, ..., ë, pouvant prendre x valeurs diffé- 
rentes, le nombre total de combinaisons différentes (ë,, . . .. ë,) est 
N = n', par conséquent chaque distribution des particules (i,, . .. 
i,) a pour probabilité 1/n'. La probabilité pour que dans la 


e e- LE | 
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première « case » il y ait r, raisins, dans la seconde r,, . .., dans la 
n-ième rh, (nn + ... +m = 7r) est 
r | _r 
rilrol...rn! 
l TT —— est le nombre de toutes les combinaisons possibles de 
n groupes de r. re, ..., r, éléments (voir la formule (2.1.6)). 
Remarquons d'autre part que pour l’observateur les raisins sont 
des particules indiscernables, et de ce point de vue toutes les distri- 
butions (i, &+, . .., à) pour lesquelles dans la première « case » 
on a r, particules, dans la seconde r,, . .., dans la n-ième r particu- 
les sont indiscernables. Dès le début on aurait pu parler seulement 
des distributions décrites chacune par un nombre r; de particules se 
trouvant dans la i-ième « case ». Si l’on considère ces distributions 
(r, ..., rh) comme équiprobables, chacune des issues (r,, . .., r,) 


. ! 
aura une probabilité différente de TS n7". Le nombre de distri- 


. .….e n° 
butions différentes, représentées schématiquement ci-dessous par 


des astérisques entre des barres verticales 


| 2 ñn 
| + s|s....|...]s * |, 
r1 r2 Tn 


coïncide avec le nombre de manières dont on peut disposer n — 1 
barres (délimitant n « cases ») et r astérisques (raisins). Ce nombre 


n—1 


est de toute évidence égal au nombre de combinaisons Cn3,-1 = 


-Wtr=Man— 4 + r éléments pris r — 1 à nr — 1 et. par con- 


(n—rj)!r! 
séquent, chaque issue (r,, ..., r,) aura la probabilité 
(n—1)!r! 
(n+r—1)!° 


Laquelle des deux solutions est exacte? Si l’on considère que le 
« mécanisme du hasard » agit de telle sorte que chacun des raisins 
puisse se trouver avec la même probabilité dans chacune des n « cases», 
ceci pratiquement indépendamment du comportement des autres 
raisins, la probabilité de la distribution (r,, . ... r,) sera 
| r | cr 


Pr, ..., ln) = en 
(ri: » Fn) rilrol...rn! 


La formule est particulièrement évidente dans le cas où nr = r = 2. 
Chacun des deux raisins tombe indépendamment l'un de l’autre, 
avec la probabilité !/,, dans l’une quelconque des deux « cases » et 


P(2:0)=P(0, 2)=17/, P(1, 1) =", 


ce qui montre que les distributions (2, 0), (0,2), (1, 1) ne sont pas 
équiprobables. 
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Dans le cas de la répartition des raisins dans la pâte le modèle 
décrit ci-dessus de distributions équiprobables (ë,, . .., ë,) n’est 
pas, de toute évidence, satisfaisant si le volume de chaque « case » 
est inférieur à celui de toutes les particules-raisins (par exemple, 
lorsque toutes les particules ne peuvent entrer dans une « case »!). 
Considérons un nouveau modèle dans lequel les « cases » sont choisies 
suffisamment petites (comparables aux dimensions des raisins), de 
telle sorte que chaque « case » puisse abriter au plus une particule. 

Ceci posé, on peut décrire chaque distribution des particules par 
une combinaison (ë,, . .., &) en mentionnant les « cases » occupées 
li, - - ., à (évidemment on suppose que r < n). Le nombre total 
de distributions discernables est alors égal au nombre de combinai- 
sons C” de x éléments r à r. Si l’on suppose que toutes les distributions 
possibles sont équiprobables (il en est ainsi dans notre modèle de la 
pâte aux raisins), la probabilité de chaque distribution (ë,, . .., ë,) 
est 

(n—r)lr! 
n | ° 

Le problème de la répartition des particules indépendantes dans 
l’espace des phases (raisins secs dans la pâte) peut se poser d’une 
autre manière. On peut demander, par exemple, de déterminer la 
probabilité de trouver, dans un domaine de volume v de la pâte, 
un certain nombre de particules. 

Divisons par la pensée tout l’espace des phases en cellules suffi- 
samment petites pour que dans chacune d'elles il ne puisse se trouver 
plus d’une particule. Tout comme précédemment nous allons suppo- 
ser que toutes les distributions possibles des particules (ë,. &+, . .. 

, à), où à, est le numéro de la cellule occupée par la r-ième par- 
ticule, sont équiprobables. Si les cellules occupées et libres sont con- 
ventionnellement représentées par des boules blanches et noires, on 
peut imaginer l'espace des phases comme une caisse contenant r 
boules blanches et n — r noires soigneusement mélangées (7 étant 
le nombre de toutes les particules dans l’espace des phases, 7 le nom- 
bre des cellules, nr > r). 

Soit m le nombre de cellules dans la partie séparée v de l'espace 
des phases et E le nombre aléatoire de particules tombant dans ce 
domaine (nombre de cellules occupées parmi les m mentionnées). 
La probabilité P . (4) pour que ce nombre EË soit égal à k,0<k< m, 
est égale à celle de trouver £ boules blanches parmi les m boules tirées 
au hasard dans une urne contenant r boules blanches et r — r noires. 

L'expression « tirées au hasard » signifie plus exactement qu'avec 
une même probabilité on choisit m boules quelconques (si l’on numé- 
rote toutes les z boules, on choisit avec une même probabilité les 
boules j,. ..., jm). Le nombre  d'’issues différentes (représentant 
chacune le tirage de telles ou telles boules j,, . .., jm) est égal au 
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=] 
Qt 


n! 
mi(n—m)l" 
ment À correspondant à ce que, parmi m boules tirées, exactement kX 
soient blanches. 

Pour trouver la probabilité de cet événement il faut calculer le 
nombre {V (4) des issues donnant lieu à l’événement À (P (4) = 


LYC , 
+”) .On peut procéder comme suit. Séparons par la pensée l’en- 


nombre de combinaisons C" = Considérons l’événe- 


semble de boules en r boules blanches et z — r noires. On peut s’assu- 
rer le tirage de À boules blanches, en tirant dans le premier ensemble 


k boules, et dans le second (m — k) boules. Désignons par a, .... &, 
les boules blanches et par b.. ., bn-les noires; chaque échantillon 
a = (a, ..., &,) de boules blanches et b — (b;. --., bj,_,) de 


boules noires peut être considéré comme un couple (a, D). de sorte 
que le nombre W (4) coïncide avec celui de divers couples pouvant 
être formés de différents éléments a et b. Le nombre total d'éléments 
a, différents échantillons de Æ boules tirées dans l’ensemble de r 
boules blanches dont on dispose, est égal au nombre de combinaisons 


Ch = , et d’une manière analogue le nombre total d’élé- 


ments b est C"=k*; par conséquent, le nombre NW (4) de couples diffé- 
rents (a, b) est égal au produit C*Cm=kR. Finalement, pour la probabi- 
lité P (4) cherchée, on obtient l'expression suivante: 


Nous avons en fait trouvé la distribution de la variable aléatoire 
E, c’est-à-dire du nombre de boules blanches tirées dans un lot de 
taille m pris au hasard (le nombre de particules dans le domaine choi- 
si de l’espace des phases), soit : 


C 
Py(k)= ET, k-=0, ..., m, (2.1.8) 


les paramètres n, r et m étant fixés. C’est la distribution hypergéomé- 
trique. 
L'exemple suivant montre l'importance de cette distribution. 


Exemple (contrôle sélectif de la production). Soit un grand lot 
d’articles à contrôler dans le but de dire s’ils sont bons ou non. Le 
contrôle de chaque article n’étant pas toujours possible (par exemple, 
dans le cas d’un contrôle destructif), on peut procéder à un contrôle 
sélectif de la production. Ainsi, par exemple, le contrôleur choisit 
dans le lot, au hasard, m articles, les vérifie et si le nombre d'articles 
défectueux est supérieur à un certain nombre critique m*, il rejette 
tout le lot. Que se passe-t-il lors d’un tel contrôle, quels sont les lots 
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rejetés et avec quelle probabilité? Si tout le lot contient n articles 
(dont r sont rejetés), la probabilité pour que, parmi m articles pris au 
hasard, exactement Æ soient rejetés est de toute évidence donnée 
par la formule (2.1.8) dans laquelle E désigne le nombre aléatoire 
d'articles rejetés dans le lot présenté au contrôle. 


Dans le problème initial sur la répartition des particules dans l’es- 
pace des phases sont donnés le nombre de particules r et le volume 
v du domaine envisagé de l’espace des phases (de volume total V). 
Il est même plus commode de considérer comme donnés non pas les 
nombres r et V. mais le nombre moyen À de particules par unité de 
volume (À = r/V), ce qui permet, comme nous allons le voir, de géné- 
raliser le problème au cas de l’espace des phases infini (plus exacte- 
ment pour V —+ o,r—- æ). De ce point de vue la formule (2.1.8) pré- 
sente l'inconvénient de contenir des paramètres superflus r et m. 
Ci-dessous on montrera qu'en fait (voir également le $ 2 de ce même 
chapitre) si le domaine considéré de l’espace des phases est suffisam- 
ment grand par rapport aux dimensions d’une particule, le nombre 
de particules Ë dans un tel domaine suit approximativement la dis- 
tribution de Poisson, soit 


plus exactement, pour #7, m, r — œ et 


(2 LL) 
a — Av = ——=rT— 
n 
constant (a étant le nombre moyen de particules dans un domaine de 
volume v), pour les probabilités P: (x) données par la formule (2.1.8) 
on a l'expression limite suivante (voir formule (2.1.13)): 
lim P;()= Let,  k=0, 1. (2.1.9) 

Revenons de nouveau au tirage dans une urne contenant r boules 
blanches et n — r noires. Nous avons examiné précédemment un 
tirage sans remise. Considérons maintenant le cas où chaque fois la 
boule tirée est remise dans l’urne (tirage avec remise en place). 
Trouver la probabilité pour que parmi m boules tirées exactement X 
soient blanches. 

Les boules dans l’urne sont numérotées de 1 à nr. Chaque échantil- 
lon de taille m peut alors être décrit par la suite (i,, . . ., im), OÙ ên 
désigne le numéro de la boule sortie lors du p-ième tirage. Les n 
boules étant tirées avec remise en place pour ip, On a n valeurs possi- 
bles (i, = 1, 2, ..., n). On a en tout #7” échantillons (ë,, . .., im) 
équiprobables. 

Considérons les échantillons contenant exactement k boules blan- 
ches. Calculons le nombre d'échantillons (i,, ..., im) à boules 
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blanches dans des positions fixes m,, . .., m, (c’est-à-dire les échan- 
tillons où les boules ë,, + my SON blanches, et les autres m — k 
boules noires). L’urne contenant en tout r boules blanches, pour cha- 
cune des boules blanches à,, pcs im, ON ar valeurs possibles et 
pour chacune des boules noires r — r valeurs possibles. Par consé- 
quent, on aura r*- (nr — r)"-* échantillons (i, ..., im) différents 
avec À boules blanches aux places m,, . .., m,. Mais parmi toutes 
les valeurs possibles 1, . .., m les différents m,, ..., mx, peu- 
vent être choisis de C#, façons différentes, alors le nombre total 
d'échantillons (ë,, ..., ë.) avec m boules blanches est égal à 
Ckr® (n — r)"-*, Par conséquent la probabilité pour que parmi 
m boules tirées exactement k soient blanches est 
C* rR (n—r}m-k 
Re  — 


_ h _! _ m—k 


où p = rin coïncide avec la probabilité de sortir une boule blanche 
lors d’un tirage. 

Ainsi, la variable aléatoire Ë égale au nombre de boules blanches 
dans l’échantillon de taille m, composé par tirage avec remise en pla- 
ce, a pour distribution 


Pa (k)= Cp (A—p}"". k=0, 1, ..., m, (2.1.10) 


où p est la probabilité de sortir une boule blanche lors de chaque 


tirage. C'est la distribution binomiale *) appelée souvent distribution 
de Bernoulli. 


Il est évident que pour un nombre de boules nr grand et un échan- 
tillon de taille m petite les tirages sans remise et avec remise doivent 
donner pratiquement le même résultat, la probabilité de tirer X 


boules blanches étant à peu près la même dans les deux cas. C'est ce 
que confirment les relations limites 


CuCnm ml Fast D (met | 
TT çm ee kl(m—hil n(n—1...(n=k+0 JT 


, no(ns—1)...(na—m+ki1) | n m | R p4 LL prit 
. = (n—k—1) | kl(m—k)! P (1 P) ’ 


où =r, ns = n — r (comparer avec les formules (2.1.8), (2.1.10)). 
En fait, lorsque le nombre total de boules » devient infiniment grand, 
la partie p — n,/n de boules blanches dans l’urne reste à peu près 


*) = k—0,..., m, sont les coefficients binomiaux dans 


m 
le développement (p+gm= Y Ch phgm*  (g=1—p). 
k=0 
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constante (rappelons que p est la probabilité pour qu'une boule prise 
au hasard dans l’urne soit blanche). 


Pour une distribution binomiale du nombre de boules blanches 
‘€ dans un échantillon de taille m la valeur moyenne ME est 


. nr hu 
M= Dénprr A —p = 
k-:1 


m- 1 
(m—1)! ] m-1-) 
mp D mere PU 
Ê 
=mpip+({—p}i=mp. (24.11) 


Trouver la distribution des boules blanches dans un échantillon de 
taille m, lorsque la partie p = r/n des boules blanches dans l'urne 
diminue (p —+ 0) mais en revanche augmente la taille rm» de l’échantil- 
lon (m—- co), de telle sorte que le nombre moyen de boules a = mp 
reste inchangé. On a 


P,(0)=(4—p}" = (1-2) es. 
Pour chaque k = 1, 2, ... donné 
P; (k) CP# (1— p}n À a—(k—i)p a 


donc 
P: A)+e, 


Pi(2)+5re, 


(2.1.12) 
Pe (k) — ral e* 
Ainsi à la limite la variable aléatoire £ a pour distribution 
PR=es, k=0,1, (2.113) 


C'est la distribution de Poisson *). 


*) Pour la différence des distributions binomiale et poissonnienne on a 
l'estimation suivante: 
x x 
SCA D esl< 


m D 
k—0 k=0 Vr 


oùC<3 Va (I. L. Hodges, L. Le Cam, The Poisson approximation of the Pois 
son-binomial distribution. Ann. Math, 31, 1960, 3, 737-740). 


sup 
x 


, 
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Bien qu’en fait à la limite on ait un échantillon infini (m—- co) 
et que le nombre « de boules blanches tirées » E puisse être aussi grand 
que l’on veut, leur nombre moyen est égal à a, soit : 

nr ah, 
ME= DK kr —4 s ki 


R—1 k—0 


(2.1.14) 


Notons également que 


eo o o a ah o 
DE= M(E— a) = MEt—a= D KL 678 — 0 — 
k=:1 


= ah-1,-a ak=1 an a a o 
=a Y[&— — 1) k— DT uE-nt* ]—a=a+a-a-a. 


(2.1.15) 


$ 2. Distribution de Poisson. 
Flux homogène d'événements et temps d’attente 


1. Distribution poissonnienne des particules. Revenons de 
nouveau au problème de la répartition des particules. Imaginons que, 
dans un certain domaine V de l’espace euclidien, r particules sont 
jetées au hasard, indépendamment les unes des autres; plus exacte- 
ment, si l’on désigne par £, la position de la k-ième particule dans 
l’espace (4 = 1, . .., r), les variables aléatoires vectorielles E,, . .. 

, &- sont indépendantes, chacune d'elles étant uniformément ré- 
partie avec une densité de probabilité 


1 , 
—— ur zEV, 
| pur Pour #6 (2.2.1) 
l O pour les x&V, 


où |[V| désigne le volume du domaine Ÿ. On désigne par À le nombre 
moyen de particules par unité de orme, soit 


= PT 


Désignons par E (v) le nombre de particules tombant dans ie do- 
maine ve Ÿ. 

Nous allons montrer que lorsque l’« espace des phases » V s'étend 
indéfiniment, avec augmentation simultanée du nombre de particu- 
les r, de telle sorte que le nombre moyen de particules par unité 
de volume reste constant et égal à À, la distribution limite de la varia- 
ble aléatoire E (v) sera poissonnienne: 


PE esiel KO, 1, ..., (222) 
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où |v|est le volume du domaine v, de plus, pour des domaines v,, . 
., Un disjoints on a 


P {E (u1) = hi, ..., E(Un) = kn} = 


_ (loi D. @ [Un DA? 
kil. n | 


e-Mivil+...+lonn, (2.2.3) 


De pair avec la formule (2.2.2) la dernière relation signifie que, 
pour des domaines disjoints v,, ..., v,, les variables aléatoires 
E (v,), . .., 6 (v,) sont indépendantes. Ce résultat est intuitivement 
clair, en effet, si on a un nombre infiniment grand de particules 
indépendantes, le fait que tel ou tel nombre fini de particules tom- 
be dans le domaine v, n'influe pas sur le nombre de particules tom- 
bant dans les domaines vw, ..., v, ne s’intersectant pas avec v.. 

Passons à la démonstration de la formule (2.2.3). Lorsque V et r 
sont donnés, chacune des r particules se trouvera dans l’un des domai- 


nes v; & V avec les probabilités respectives p;, = ler i = 0, 1, 
p IN j’ 


., n. où v, est ici le complément de v, |] ve | . U Uh, jusqu'à 
tout le domaine V. Répartissons nos E,, ..., E, particules en nr + 1 


groupes de k,, ..., kh, r, particules dans le groupe correspondant, 
k+... +kn =k, ro =r—k; le nombre de variantes différen- 
tes lors de cette répartition est égal à ETS (voir (2.1.6)). 


L'événement {E (v,) = k,, ..., E (v,) = k,} se réalise si et seule- 
ment si un certain groupe de 4, particules tombe dans le domaine »,, 
un groupe de k, particules tombe dans le domaine v,, etc., les r, — 
— r — k particules restantes appartenant au domaine v,. Indépenda- 
damment des autres, une particule quelconque se trouvera dans le 
domaine correspondant v; avec la probabilité p;, à = 0, 1, ..., n, 
définie ci-dessus, par conséquent, la probabilité pour qu'un certain 
groupe de k, particules se trouve dans v,, un autre groupe de a par- 
ticules se trouve dans v,, etc. sera égale au produit p#!- 

kn.pro, Les différentes variantes de répartition de PE cules 


r! 
en groupes donnant les FR issues incompatibles ayant cha- 


cune la probabilité mentionnée p#i ... prnpr, l'événement 


{E (ui) = #1, . .., E (vn) = k)} coïncidant avec la réunion de ces 
issues a la probabilité 


r ! kn ro 


Re Pt . Pn' Po (2.2.4) 


En utilisant la formule de Stirling, en vertu de laquelle 


= Vauwre", (r—k)!eV2n(r—Rk)(r—k) et, 
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pour À,, ..., k, donnés et r — oo on a 
Cr r \r-k k \r-k k 
V 1. (=) =(1+—) TE 
k 
k,_k lu; i R; . 
part = (tr) =(Alul)", i—1, ...,n, 
[vol=|VI—-(ul+...+lunl) 


et 
To __ Fusl+ ... Hu |) Th 
Po = (1 [VI ] — 
= (4 UE EDR NT  e-misitte 24e D, 


r 


Finalement pour r—oo et À—r/|V]| constant on a 


r ki ln ho Ale... GleaDEr … 
AT TR Pt ce PP 6 AR en D, 


c'est-à-dire qu'à la limite on obtient la formule (2.2.3). 


La distribution de Poisson (2.2.3) se définit par un seul paramètre 
À, 0 LÀ << oo, valeur moyenne des particules par unité de volume: 
À = ME (v}/| v] (voir (2.1.14)). Cette distribution possède les pro- 
priétés spécifiques suivantes: 

a) les variables aléatoires £ (v,), . . ., & (v,) pour les domaines 
disjoints v,, ..., v, sont mutuellement indépendantes ; 

b) la probabilité de trouver dans un domaine v un certain nombre 
de particules ne dépend pas de la situation du domaine v dans l’espa- 
ce des phases (mais seulement de son volume |v |); 

c) la probabilité pour une particule de tomber dans un domaine 
de faible volume | v| est proportionnelle à |v| à des infiniment petits 
d'ordre supérieur près: 


P{E (0) =1}=Ablertel = À lo] + 0 (lv), 


et la probabilité pour plus d’une particule de tomber dans le domaine 
de volume [lv] pour [v|—- 0 est une grandeur infiniment petite d’or- 
dre supérieur: 


PEO>1}= > Eee ou). 


k=—2 


Nous allons montrer que toute distribution de particules satisfaisant 
aux conditions a), b) et c) est obligatoirement poissonnienne. 

I] suffit de montrer en fait que l’on a la formule (2.2.2) (d’où sous 
la condition a) découle la formule plus générale (2.2.3)). Nous utili- 
serons le même procédé de division du domaine v en petites « cases » 


6—0521 
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An k=1,...,n, de volume | A4] = ll que dans le point 2 du 


paragraphe précédent (comparer avec (2.1.9)). En vertu des condi- 
tions a) et b) la probabilité de l’événement 


{8 (Ai) = Î, p=1,...,k, 5 (As) = 0, p=k+1,...,n} 


est la même pour toutes les combinaisons (ë,, . .., éx), (ég+y, + + - 
. + in) et est égale au produit 


(P {5 (A) = 1})* (P {E (A1) = 0})"*; 


puis, en vertu de la condition c), pour 7 — la probabilité pour 
qu’une « case » quelconque contienne plus d’une particule ne dépasse 
pas la somme 


D P{(0)>1}=n-0{|A1]} +0. 


par conséquent, posant 
pour #—0c0 on obtient (voir (2.1.13)) 


P{E(&)=k}- D  P{(Ai,)=1, p=1, ...,k, 


(it, .….. in) 


ë (Ai,) = 0, p=k+1, .. n} = CF (P {E (A:) = 
=1} (P ( (A1) =0)"#  Chph (1 pjh Les, 


où a = np = À lv|. 

Notons encore la propriété suivante de la distribution de Poisson : 
sachant que dans un certain domaine V tombent exactement r particules, 
la distribution de ces particules dans V sera la même que si elles y étaient 
jetées au hasard, indépendamment les unes des autres; plus exactement, 
les variables vectorielles E,, . . ., E, décrivant les positions de ces parti- 
cules seront. indépendantes et uniformément réparties dans le domaine V 
(avec une densité de probabilité de la forme (2.2.1)). 

En effet, pour tous les domaines disjoints v,, ..., v, la proba- 
bilité conditionnelle P {E (v,) = k,, ..., E (1) = k;|E (V) = r}est 


P {8 (1) = gs +. 5 (Un) = Kns 8 (o) = rot _ 
P {E(V)=r} 
QD lon acioitte..+ient+ito) 
Real ""  kal … 
CRAN S = 


r| 


— ki 
Hi. Miro Pi **: Pn Po 


ce qui démontre notre assertion (comparer avec (2.2.4)). 
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Exemple (processus de désintégration radioactive). On sait 
que le radium (Ra) se transforme avec le temps en radon (Rn)}. Le 
noyau de l’atome de Ra émet une particule (noyau de l’atome d'hé- 
lium He). La désintégration d’un atome de Ra ayant lieu indépen- 
damment de l’état des autres atomes de la substance, le rayonne- 
ment & représente un flux d’un grand nombre de particules indépen- 
dantes. Il est naturel de s'attendre à ce que la répartition des particu- 
les & dans le temps soit poissonnienne, alors la probabilité pour que, 
durant l'intervalle de temps A, le nombre E (A) de particules a 
rayonnées soit exactement égal à Æ sera 


P {E (A) =k}= AP e-xlal, k=—0,1, ..., (2.2.5) 


où |A | est la longueur de l'intervalle de temps considéré et À le nom- 
bre moyen de particules « émises en unité de temps: À — T 
(le processus de désintégration radioactive sera étudié plus en détail 
dans le point 2 suivant). Ce résultat se trouve confirmé par les données 
expérimentales *). 


Certes, la distribution de Poisson apparaît non seulement lors 
de l’étude d'un flux homogène de particules indépendantes, mais éga- 
lement dans d’autres cas. Il peut, par exemple, s'agir d’un flux 
homogène de demandes, arrivant dans un certain système de service 
(arrivée des automobiles à une station d'essence, arrivée des deman- 
des à un bureau de renseignement, un flux de refus de communication 
enregistré dans un central téléphonique, etc.). Dans le cas général, il 
peut s’agir d’un flux homogène d'événements indépendants observés 
pendant un intervalle de temps: les instants de ces événements peu- 
vent être interprétés comme des « particules » réparties d’une façon 
aléatoire sur la droite réelle (axe du temps). Un flux d'événements 
E (A) est dit poissonnien et sa distribution est décrite par (2.2.5) si 
sur l'intervalle de temps À il satisfait aux conditions a), b). c) 
mentionnées ci-dessus, à savoir : 

a) les variables aléatoires E (A,), . .., £ (A,) pour des intervalles 
de temps disjoints A,, .... À, sont indépendantes; 

b) la probabilité de réalisation d’un certain nombre d'événe- 
ments dans l'intervalle À ne dépend pas de l’origine des temps (ne 
dépend pas de la disposition de A sur l’axe des temps); 

c) la probabilité de réalisation d’un événement dans un intervalle 
de temps petit est proportionnelle à la longueur | A | de cet inter- 
valle et la probabilité de réalisation de plus d’un événement est un 
infiniment petit d'ordre plus élevé que |A |. 


2. Temps d'attente d’un événement aléatoire. Considérons les 
lancements successifs d’une pièce de monnaie jusqu’à la première 


*) Voir, par exemple, l'ouvrage déjà cité de W. Feller 
6* 
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apparition de « face », la pièce étant jetée une fois par unité de temps. 
Il est évident que la durée de l’expérience (temps d'attente de « face ») 
est aléatoire. Les épreuves (différents lancements d’une pièce de 
monnaie) étant indépendantes, à aucun des instants £ >> 0 la position 
de l’observateur n’est meilleure (pour le temps d'attente de « face ») 
qu’à l'instant initial £ = 0, c’est-à-dire que la probabilité d’atten- 
dre un intervalle de temps s après l'instant £ est la même que celle 
d'attendre ce même temps s à partir de l'instant initial; plus exacte- 
ment, si test le temps d'attente, pour t >> t on doit avoir 


PT>œt+st>/ =P(>Ss). (2.2.6) 


En effet, pour tout £ = 0, 1, ..., l'événement {t > t} signifie 
que lors de { épreuves indépendantes on n'obtient aucune fois « face » ; 
en revanche 

P {rt} = (41 —p}, 1 —=0,1,..., (2.2.7) 


où p = !/, est la probabilité d'obtenir « face » dans chaque épreuve, 
donc 
P{T>t+s 
PU>I+SIrSH= pass UP -PU>Ss) 

On peut dire que la relation (2.2.6) caractérise le temps d'attente 
x d’un événement À tel que son temps d'attente avant l'instant !t 
n’approche pratiquement pas son apparition. Dans cette situation, 
dont un exemple simple est donné ci-dessus, la distribution de la 
variable aléatoire 7% est telle que 


P{r>t}=e"t, 1>0, (2.2.8) 


où à est un certain paramètre (4 > 0); pour # = 0, 1, ... discret 
la formule (2.2.8) peut s’écrire sous la forme (2.2.7), en posant p — 
= 1 — ee}. 

Pour t discret cette distribution est dite géométrique : 

P.{k) = e-Mà-1) — e-kk = p (4 — p}f-1, k —1,2,... (2.2.9) 


Pour t continu, 0 < t < oo, la distribution (2.2.8) a pour densité 

de probabilite : 
ke-#t pour t > 0, 
Px (£) — 0 
pour £<TÙ 


(la fonction de répartition de t étant F.() =1—P{r>it} 
et p. (t) = F4: (t)); cette distribution est dite exponentielle. Le pa- 
ramètre mentionné À reçoit un sens probabiliste simple, à savoir 1/4 
est le temps moyen d'attente: 


(2.2.10) 


+=Mr= | tp (dt. (2.2.11) 
0 
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Nous allons déduire la formule (2.2.8) à partir de la relation 
(2.2.6), en supposant que t = O0 seulement avec une probabilité 
nulle et que lorsque le temps est continu, la grandeur + a pour t > 0 
une densité de probabilité continue. Définissons la fonction f (&) par 
l'égalité f (4) = P {t>t}; la formule de la probabilité totale donne 


P{t>œit+s}=P{r>s}P {T>t} 
par conséquent, la fonction f (t) est telle que pour s, £ > 0 quelcon- 


ques, on a 
f(s+t) = f{s)f() 


log f (s + t) = log f (s) + log f (à), 
avec f(0) = P {rt > 0} = 1. Pour t discret (4 — 0, 1, ....) il 
s'ensuit que log f (t), log f (0) = 0, est une fonction linéaire, soit 
log f (4) = t log f (1) 


et f (4) = (4 — p)' = eh, où p =1—f(41) = P {rt = 1}. 
Pour { continu (sous la condition que la densité p, (t) = 
= — f (t + 0), t > 0, existe), la dérivation par rapport à s donne 
fU+Ss) __ f{s) 
f(+s)  f(s) 
d’où pour s = 0 on obtient 
f"() 
Ê CE) À, 
où — À — f (0) < O0. car A 4 est la valeur maximale de la 


fonction f( =P {tt}, 1>0. Par conséquent, f (t) = e-", 
ce qu’il fallait démontrer. 


ou 


E x e mple (modèle de la désintégration radioactive). Nous avons 
déjà mentionné que la distribution des particules &« émises par le 
radium est poissonnienne. Supposons que la transformation du radium 
Ra en radon Rn (donnant lieu à l'émission d’une particule &) se dé- 
roule de telle sorte que durant l'intervalle de temps (£, {,) un atome 
de Ra pris séparément se transforme en un atome de Rn avec la pro- 
babilité p = p (t) dépendant de la longueur t = {, — t, de l’inter- 
valle considéré. 

Si avant l'instant £, iln’y a pas eu de transition Ra—- Rn, à l'ins- 
tant {,. considéré comme un nouvel.instant initial, on a affaire au 
même atome Ra et la transition Ra — Rn durant l'intervalle de 
temps suivant s = {, — !,, en vertu de notre hypothèse, doit être 
réalisée avec la même probabilité p (s). Il est clair que le temps d’at- 
tente t de la désintégration Ra — Rn d’un atome donné de Ra (à 
partir de l'instant t,) satisfait à la relation (2.2.6), car la probabilité 
conditionnelle P {t>t+s|Tt>t} est la probabilité pour que 
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l'atome de Ra, intègre à l'instant £,, ne se désintègre pas durant l’in- 
tervalle de temps suivant (4, &.), mais par hypothèse cette probabi- 
lité (tout comme la probabilité P {t > s}) est égale à 1 — p (s), 
S = ta — t,. Par conséquent, la distribution du temps d'attente + 
suit la loi exponentielle (2.2.8). 

Cherchons à éclaircir le sens physique qu'il y a lieu d'attribuer 
à la constante À. Nous savons déjà que 1/À est le temps moyen d’at- 
tente de la désintégration Ra — Rn pour un atome isolé (voir 
(2.2.11)). Il est tout naturel de considérer que la constante À est la 
mème pour tous les atomes de Ra. 

Désignons par nr, la quantité de radium (le nombre d’atomes de 
Ra) à l'instant initial {,. Chaque atome de Ra durant le temps t a pour 
probabilité de désintégration (Ra — Rn) la quantité 


pt) =1—e#; 
si l’on désigne par E£ (ft) le nombre d’atomes de Ra se désintégrant 


durant ce temps (coïncidant d’ailleurs avec le nombre de particules 
a émises), la valeur moyenne ME(t) sera 


ME(?) = 20p (t) = no (1 — et). 


Par conséquent, au bout du temps # la quantité de radium sera en 
moyenne égale à 


n (i) = M (no — Ë (0) = ro — ME (4) = rie". 


On peut caractériser la dépendance exponentielle de £{ non seule- 
ment par l’exposant À mais également par la période 7 de demi-vie, 
temps au bout duquel la moitié de la masse initiale s’est désintégree ; 
T est donné par l'équation 


n(T)=; 


d’où l'on tire T = 2er (on a trouvé expérimentalement que pour le 


radium 7 = 1590 ans). 
Considérons maintenant le modèle général du flux poissonnien 
d'événements, où l’on suppose qu'indépendamment du nombre et 


des instants d'apparition des événements avant l'instant courant 4,. 
dans l'intervalle de temps (4, f,) exactement À événements apparais- 


R 
sent avec la probabilité M e-nt, & — 0. 1,...(oùt=4 — +). 


On voit que le temps aléatoire d'attente (après l'instant t,) d'un 
événement suivant a une distribution exponentielle de paramètre À: 


P{ui—-th>t} = P {E (lo, 1) =0}=e"M, (2.212) 


où t, désigne l'instant d'apparition du premier, après l'instant #,, 
événement et £ (4, £,) le nombre d'événements dans l'intervalle de 
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temps (4%, £); le paramètre À de cette distribution exponentielle 
est le même que dans le flux de Poisson initial (le nombre moyen d’é- 
vénements par unité de temps). 

Par conséquent, dans un flux d'événements poissonnien, même 
après une attente très longue d'un événemet, celui-ci aura lieu dans 
l'intervalle de temps  (4,, {.) suivant avec la même probabilité 
1— es, s = 1, — t,, comme s'il n'y avait eu aucune attente et 
que {, était le moment initial de l’observation (£, = to): 


e-?.({+s) 
P{u—b>t+sn—-bo>t}=—5g <e"=PU—h>s} 


€ 


Soient T,, .... T, des instants aléatoires d'apparition d’événe- 
ments successifs d’un flux poissonnien. Soit un instant quelconque 
li, T Li L Te. Après l'instant £,. indépendamment de 7, l’événe- 
ment prochain se produit durant le temps £{ avec la probabilité 
1 — e-hM, par conséquent la probabilité conditionnelle pour que 
{ t — 1, Lt} pour 7, quelconque, 7, < #,, est 


Pit —-h<ilu nu <h} = 1—e xt. 
D'où pour 7, = {, on obtient 
P{tm—-h<t|u=hu}= 
=P{r -t<t|[n =} =1—-e"ht. 
On voit que la densité de probabilité conditionnelle p ({1£,), t > 0, 
de la variable +, — +, sous la condition 7, = t, pour tous les £, => t, 


est la même et égale à Àe”At. Par conséquent la densité « incondition- 
nelle » est 


P (t) = | P(t| #41) Pr (1) dti = he-ht, 
to 


c'est-à-dire que la longueur de l'intervalle de temps t: — 7‘, est égale- 
ment répartie suivant une loi exponentielle de même paramètre À: 


P{r —Tt>pt}=e"t, 1>0. (2.2.13) 


Des considérations analogues concernant les instants t,_, et 7, 
permettent de conclure qu’indépendamment des instants T,, T:, . .. 
-... Th d'apparition des événements antérieurs (par conséquent 
indépendamment des intervalles t: — Tt,, . .., Th] — Tn-o T1 — 
— tt), on a 


P{m—tmni ét, Te... nn} = 
= Pf{i, — tm >t}=e-t.  (2.2.14) 


Finalement on arrive à la conclusion que les intervalles t, — t,, 
To — TU, - - . Séparant les événements successifs d’un flux de Poisson, 
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sont des variables aléatoires indépendantes obéissant à une même loi 
exponentielle de paramètre À (À étant le nombre moyen d'événements par 
unité de temps). 


Soient E, £+, . .. des variables aléatoires indépendantes de 
même loi exponentielle de paramètre À; posons 


Sa =t+... +. (2.2.15) 


Si E = Ti — to, Eo = To — Ty, - .. sont les intervalles séparant 
les événements d’un flux de Poisson, la variable aléatoire S, n’est 
autre chose que le temps d'attente du n7-ième événement, c'est-à- 
dire que Sy = tn — to. L'événement {S, < t} signifiant que durant 
le temps t il s'est réalisé au moins x événements, la fonction de ré- 
partition de la variable non négative S, est 


ni 
R 
P{Sgt}=1— 5 le-n, 120. 
R=0 


En dérivant cette expression par rapport à £ on trouve la densité 
de probabilité correspondante, soit 


p(t)= 2-0 


(n —1)! 
pour {0 pt) = 0. 

La distribution obtenue fait partie de la famille des « distributions 
gamma » (nous étudierons certaines d’entre elles plus loin). Dans le 
cas général la densité d’une « distribution gamma » est donnée 
par la formule 


et, t1>0, (2.2.16) 


Br, 
TE et € pour i>0, (2.2.17) 
0 pour 4<<0, 


où «, B sont des paramètres positifs et 


T (œ) — | t2— let di 
û (2.2.18) 


(Ta+1)=ar (a), T(+)=Vxr, l(n+t)=n! 


est la fonction gamma eulérienne. Pour & = n, Bf = À on a la dis- 
tribution (2.2.16) et pour rz = 1 la distribution exponentielle. 
Pour conclure nous allons nous arrêter sur un fait qui, au premier 
abord, pourrait paraître paradoxal. Tout comme précédemment, 
considérons un flux d'événements poissonnien, c’est-à-dire qu'’in- 
dépendamment du nombre et des instants d'apparition des événe- 
ments à l’extérieur d’un certain intervalle (s, {), dans cet intervalle 
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k événements se réalisent avec la probabilité 
AS ar eàG-s), k=:0, 1, .... 


Supposons que les événements soient enregistrés sur l’axe des 
temps — oo << { << © et que l’observateur arrivé à un certain instant 
l, s'intéresse à l'intervalle entre deux événements successifs, l’un 
s'étant produit avant l'instant #, (l’instant de son apparition sera 
désigné par t..) et l’autre après l'instant 4,, à l'instant désigné com- 
me précédemment T:. 

Nous avons déjà établi que les intervalles entre des événements 
successifs (par exemple t; — T,, T3 — T2, etc.), de même que t, — to, 
sont répartis suivant une loi exponentielle de paramètre À. On pour- 
rait penser que la différence (t, — t_,) a la même distribution, bien 
que ceci puisse paraître étrange, vu l'inégalité (t, — t_,) >> (t, — to), 
d’où il découle que les grandeurs mentionnées ne peuvent avoir même 
distribution. Pour trouver la distribution de l'intervalle (x, — t_,) 
on peut tenir compte du fait que le sens d'écoulement du temps n’a 
aucune influence sur les relations probabilistes dans un flux d’évé- 
nements poissonnien, celles-ci seront les mêmes pour un flux d’évé- 
nements rétrograde, obtenu formellement en remplaçant { par — #, 
— 00 << { TZ co. Par conséquent, pour un instant fixé £, tel que t_, << 
< ty € TG, non seulement la variable (x, — 4,), c'est-à-dire le temps 
d'attente de l'événement prochain, sera répartie suivant une loi 
exponentielle, mais également la variable (4, — t.,), le temps d’at- 
tente de l'événement prochain dans le « flux inverse ». De plus, com- 
me nous l’avons déjà noté, la variable (rt, — £,) ne dépend pas de 
l'instant de réalisation, avant l'instant t,, de l'événement antérieur ; 
ainsi, pour T_, < lo T1, les variables (rt, — £,) et ({, — T_,) sont 
indépendantes. Par conséquent la distribution de la différence 
(T1 — T1), c'est-à-dire de l’intervalle entre des événements voisins 
(sous la condition t_, << {y << T,, l'instant {, étant fixé), est la 
même que celle de la somme (7, — #5) + (ft — t_,) de deux variables 
indépendantes de même distribution exponentielle (la densité de 
probabilité correspondante est donnée par la formule (2.2.16) pour 
n = 


$ 3. Epreuves de Bernoulli. Mouvement brownien 
et distributions correspondantes 


1. Epreuves de Bernoulli et distribution binomiale. Approxi- 
mation de Poisson et approximation normale. On appelle épreuves 
de Bernoulli des épreuves identiques indépendantes, dans chacune 
desquelles on envisage un certain événement À, apparaissant avec 
une même probabilité positive p = P(4). L'événement 4 est dit 
conventionnellement « succès », et son complément 4, apparaissant 
dans toutes les épreuves avec la probabilité q = 1 — p, est dit «échec». 
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Dans une épreuve nous désignerons le « succès » par une unité 
(1), et un « échec » par zéro (0). Alors chaque issue élémentaire w — 
— (0, . .., @,) de nr épreuves sera représentée par une suite de zéros 
et d'unités (w; = 1 avec la probabilité p et w; = 0 avec la probabi- 
lité 1 — p). La probabilité P (wo) d’une issue élémentaire w. où l’on 
observe exactement k « succès » et n — k « échecs », sera. compte 
tenu de l'indépendance des épreuves, 


P (o) = pa. 
Soit la variable aléatoire £ égale au nombre total de « succès » 


dans » épreuves de Bernoulli : E (wo) = k si une issue élémentaire w 
amène exactement «À « succès ». 


24 6 8 WP 64% 


Fig. 12. Les points sur les graphiques désignent les probabilités binomiales 
Pa (k)=Chph (1 — p}u-k, k = 0, 1, ..., n, pour n = 20, correspondant au 
paramètre p — 0,1, 0, 3, 0,5 respectivement. 


Le nombre de différentes issues © amenant un même nombre k 
de « succes » est égal au nombre de combinaisons de n éléments k à k, 


. k n! 
soit Ch  Hin—=bi: 


P (w) = p“g"-*, l'événement {& = k} a pour probabilité Cap"g"-" 
Ainsi, la distribution de la variable aléatoire ë est donnée ar la 
formule 


Toutes ces issues w ayant la même probabilite 


P:(k) = Cip“g"", k=0,...n. (2.3.1) 


Il s'agit de la distribution binomiale (fig. 12) que nous avons déjà 
vue précédemment (voir (2.1.10)) lors de l’étude des tirages dans une 
urne, où le « succès » correspondait au tirage d’une boule blanche, et 
l’« échec » au tirage d’une boule noire. Cette loi est définie par deux 
paramètres: la probabilité p d’un « succès » et le nombre d'épreu- 
ves n. 

I1 est bon de noter que la variable aléatoire E est la somme de 7 
variables indépendantes E;. ..., E, définies comme suit: E; = 1 
si dans la k-ième épreuve on a un « succès » et E, = 0 si dans cette 
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épreuve on a un « échec »: 


E=bh +... +E. (2.3.2) 


ME, = p, 
DE, = MES — (ME) = p — p° = p (1 — p) = pq, 


et compte tenu de (2.3.2), on a les expressions suivantes pour l’es- 
pérance mathématique et la variance de E: 


ME = np, DE = npq. (2.3.3) 


Lorsque le nombre d'épreuves n est très grand, alors, bien que les 
« succès » soient relativement rares (la probabilité p est faible), le 
nombre moyen de «succès » np est assez grand et on peut estimer que 


P, Bees, k= 0,1, .., (2.3.4) 


En remarquant que 


où a = np est le nombre moyen de « succès » (voir (2.1.12)). C'est 
ce qu'on appelle l’approzimation de Poisson de la distribution binomia- 
le (fig. 13). 


P,l#) 
05 


02 


24 6 1 WRI 00% 
Fig. 13. Les points sur les graphiques désignent les probabilités de Poisson 
P;(k) = Te, k — 0, 1, ..., correspondant au paramètre À — 2, 6, 10 
respectivement (À — np pour n == 20 ct p = 0,1, 0,3, 0,5; comparer avec Îla 
fig. 12). 

Dans les applications on utilise souvent les épreuves de Bernoulli 

pour la détermination expérimentale de la probabilité 
p = P (4) 


de tel ou tel événement À (du « succès » dans une épreuve) dont l’es- 
timation empirique est la fréquence du « succès », soit 


pe (= 2 Ex). (2.3.5) 
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En vertu de la loi des grands nombres on a 
P = lim (4) , 
n— co 
l’écart quadratique moyen entre l’estimation adoptée par l’observa- 
teur ne 2@ Ge la probabilité inconnue P (4) et la valeur réelle”p est 
"(4) _,|| _ VDS = _P4 
P — n — n ? 


n 


ñn 
où S, = dE, n’est rien d’autre qu’une nouvelle désignation du 
Rk= 


nombre de « succès » dans nr épreuves indépendantes. Ainsi, dans la 


représentation 


sous | a pour valeur moyenne 0 et 
" (4) 


- pour variance 1; on voit que l'écart probabre entre la fréquence —— 


la variable aléatoire S3 — 


et la valeur inconnue p est de l’ordre de —— De Nous allons donner un 
résultat plus précis. 
Théorème (de Moivre-Laplace). Pour n—> oo la variable aléatoire 
S* admet une distribution limite, à savoir 
. 1 t 2. 
LS LT} = — | ex? dx 2.3.6 
imPt <si<r}= (2-5:8) 


pour x’, x" (x < x”) donnés quelconques. 
Cette distribution est appelée distribution normale (ou gaussienne), 
sa densité est 


+’ 


p (x) = = e-X#2, —o0 <Lr< oo. (2.3.7) 

Passons à la démonstration de la relation limite (2.3.6). La va- 
riable normée S? prend d'une façon aléatoire l’une des valeurs z de la 
forme 


LT = — ) k=0, 4, _.. nm; 
n pq 
divisant le segment [ZE | en intervalles égaux de longueur 
ë Vnpq” Var 
Î 
x = 
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de plus 
! n- 
P{SA= 2} = Pon (= ET p*q k, k=0, 1, ..., De 
Il est évident que pour 7 — oc on a 


k = np+Vnpgz—oo, n—k = nq — V npqgz—+ 


uniformément par rapport à x, z << z < zx”. En utilisant la formule 
de Stirling on obtient 


V'2nnnte-n 


V 2nk kkhe-R 1/27 (n—k)(n—k) n-Renh 
2 | ngq n—kh 
= eV re k ) (5) ° 


Ps, (4) — 


Remarquons ensuite que 


k "q —k 
44 t LL, ii) Lz 
np np nq nq 


d'où, en utilisant le développement 
1 
In (1+ an) — an — an 
(pour œn—0), on obtient 


In (É) "= rm (14 L 2) 
= —{(np+V rpg 2) [V/£z 5e]; 
In (UE) PE Lu in (1-7 22) 
avan [-V Here] 


Ajoutons ces expressions, il vient : 
. =) ngq )"]=-5# 
lim In | ( k ] n—k = 2 T 
et par conséquent 


2eY (= = #22 
din (He) (ner) ere 


Puis 


V = LR 1 1 Az 
k(n —k) npnq Vnpq ? 
et finalement 


P (Si=a- 


e-x#/2.Azx, Ar = 


1 
Vnpq ‘ 
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k— np 
Var 
PAS =2)=7ne 2. a 0 (A) 


z' LIT. 


ceci uniformément par rapport à tous les x == 


Par conséquent 


uniformément par rapport à tous les =. z' Liz” et 
n pq 


pour 7 —- co 


1 

271 

x” x” 

D e-*/2Ar<+o(i) — 1 | ex? dx 
, va) + 


x 


x” x" 
P{z' <Si<z} = D P {Sai=1}= Ÿ [e-*#/2Ax + o (Ax)] = 


à 


1 
V2x 


ce qu’il fallait démontrer. 


10 PT) 


81 


0 5 9 1 2 3 


Fig. 14. Allure générale de la fonction de répartition normale © (x) de para- 
mètres (0, 1) et de la densité de probabilité correspondante. 


Ainsi, pour la distribution de la variable aléatoire S; on a l’ap- 
proximation (normale) suivante: 


P{r <S<z"}z O(:7) — ® (rx), 
où ® (x) = = je-ur 2 du est la fonction de répartition normale”de 


densité (2.3.7) (fig. 14). Une meilleure approximation est donnée par 
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la formule suivante *) 
Az AY: 
P {z' <Sa<zr'}=OD (z+—) —O (+) , 
où Ar — 


. Pour la différence des fonctions de répartition 

np 
F(x) = P {Si <z}et O (x) on a l'estimation suivante (voir plus 
bas (2.4.19)): 


sup|F (x) —D(z)|<C (2.3.8) 


1 
Ve” 


où C< Ha. 
Pq 
On donne ci-dessous une table de valeurs de la fonction de répar- 


tition normale (x) — = |e e-“= du pour 0, 0Szr<4,5 


V2r 
(table 2). 


Table 2 


| ® (x) | ® (x) 


0,999032 
0,999313 
0,999517 
0,999663 
0,999767 
0,99981 
0,999892 
0,999928 
0,999952 
0, 999968 
0,999979 
0,999987 
0,999991 
0,999995 
0,999997 


0,945201 
0,955435 
0,964070 
0,971283 
0,977250 
0,982136 
0,986097 
0,989276 
0,991802 
0,993790 
0,995339 
0,996533 
0,997445 
0,998134 
0,998650 


+ 
+ 


L ] 
- 


D ] 
LR] 


%* 
D ] D ] D] LR] 


ovomim us & ND = © © Co 1 


0,617911 
0,655422 
0,691462 
0,725747 
0,758036 
0,788145 
0,815940 
0,841345 
0,864334 
0,884930 
0,903200 
0,919243 
0,933193 


- 


D ] 
LR] 
+ 


- 
L 1] 
D ] 


+ 
+ 


LR] 


D] 


LD] 
+ 


LR] 


D ] 
+ 


D ] 
LR] 


L ] 
LR] 


+ 
- 


BND ND D D = = = 
Æ SJ LE EN EN O0 O0 5 0 © C9 Co © Co 
1 En ON 2 © © 0 1 E O1 En EC 10 à 


+ … L L ] + 


LI 
- 


0 
0 
(1) 
0 
0 
0 
0, 
0 
0 
0 
1 
1 
1 
1 
1 
1 


en à © © © © © Co 1 O Ut à 0 NO» © 


2. Mouvement brownien. Distribution du maximum et instant 
de ce maximum. Imaginons une particule suspendue dans un liquide 
homogène. Elle subit des chocs chaotiques avec les molécules de liqui- 
de, ce qui a pour effet un mouvement incessant de la particule. 


*) Voir, par exemple, l’ouvrage déjà cité de W. Feller. 
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L'analogue discret de ce processus peut être le modele du « voya- 
geur errant ». La particule change de position seulement à des instants 
discrets, multiples de At. Le changement de position s'effectue de 
telle sorte qu’à partir d’un point zx, indépendamment du comporte- 
ment antérieur, la particule passe dans l’un des points voisins z + 
+ Az ou x — Azx, ceci avec des probabilités égales, le déplacement 
Az étant le même pour tous les points x (il s’agit des déplacements de 
la particule sur un axe). A la limite, lorsque At—+ 0, Ar —+ 0, on 
obtient un mouvement aléatoire permanent, caractérisant le proces- 
sus physique du mouvement brownien *). 

Désignons par & (£) la position d’une particule brownienne à l’ins- 
tant {. Supposons qu’à l'instant initial £ = 0 la particule se trouve 


au point z = 0. En faisant des déplacements aléatoires discrets elle 
fera en temps { n — re pas dont certains dans le sens positif. En dé- 
signant par S, le nombre de pas dans le sens positif, le déplacement 
dans le sens positif sera S,Azx, et dans le sens négatif (n — S,) Az. 
Ainsi le déplacement total E (£) durant le temps { = nAt est lié au 


nombre S, par l'égalité suivante: 

E (4) = [S, Az — (n — S,) Az] = (2S, — n) Az. 

Si l’on suppose que £ (0) =0,ona 

E(s+t) = [IE (s) — 8 (O0) + LE ( + 5) — E (s)] 
pour s, { > 0, quelconques. Dans le modèle décrit du mouvement 
aléatoire les variables E (s) — & (0) et & (£ + s) — E (s) sont évidem- 
ment indépendantes, la distribution de l'accroissement E (£ + s) — 
— E (s) étant la même que de l’accroissement E (£) — E (0). Donc pour 
s, t > 0 quelconques on a pour la variance DE (£ + s) l'égalité sui- 
vante : 

DE (t+s) = DIE (s) — E (0)1 + D EE (+ s) — E& (s)] = 
= DE (s) + DE (1). 

On voit que la variance DE (t) en tant que fonction de ft varie linéai- 


rement avec {: 
DE (4) = ot, 0OKi< 0, 


où 0° est une certaine constante appelée coefficient de diffusion. D'un 
autre côté, il est facile de voir que la variance du déplacement durant 


le temps £ (autrement dit, pour r pas, nr =) est DE (4) = (Az? . 


At 
Finalement on obtient la relation suivante entre Az et At: 
(Az) 2 
At gr. 


*) Voir, par exemple, l'ouvrage de A. Khintchine, Lois asymptotiques de lu 
théorie des probabilités (en russe), Moscou, 1936. 
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Les déplacements élémentaires de la particule étant indépendants, 
on peut les considérer comme des épreuves de Bernoulli où l’on attri- 
bue au « succès » (un pas dans le sens positif) la probabilité p = /.. 
Le nombre de pas dans le sens positif $, sera égal au nombre de « suc- 
cès » dans n épreuves de Bernoulli. La position de la particule à l’ins- 
tant ? sera alors liée de la manière suivante à la variable normée 

1 
SA = VF (28h — n) : 
E(t)= SAV n Az =S* 


= Sio Vt. 


En utilisant le théorème de Moivre-Laplace (voir la relation (2.3.6)) 
on obtient à la limite pour la distribution de la variable aléatoire 
ë (4) la formule suivante: 
x” 
ë (4) — 1: ’ * #\ — 1 ° —x2/2 
P {r gi A < } = Jim P { LSÈLz'} 7= | dx. 
(2.3.9) 


La formule (2.3.9) donne aussi bien la distribution de la variable 
E (t), position d’une particule brownienne à l'instant {, que d’un 
déplacement quelconque d’une particule animée d’un mouvement 
aléatoire durant le temps é, car en vertu de l’homogénéité du proces- 
sus envisagé l'accroissement E (£ + s) — E (s) pour Ë (s) quelconque 
est distribué de la même façon que l'accroissement £ ({) — E (0) — 
= £ (it), à savoir 

Si UHS)—E(s) 1 1 —x?;2 
P{r< os V <r}= =] ce dx. 


! 

Sur la figure 15 on a représenté quelques trajectoires expérimenta- 
les du mouvement brownien *). 

La simulation du mouvement brownien peut être réalisée à l’aide 
de la « planche de Galton ». Cet appareil représente une planche plane 
inclinée avec des clous disposés symétriquement ; jetée d’en haut, 
une bille qui joue le rôle de particule brownienne, lors de son mouve- 
ment vers le bas, se heurte aux clous et à chaque fois se déplace avec 
une même probabilité d’une distance À à droite et à gauche; après 
n chocs (7 étant égal au nombre de clous sur la verticale) la bille oc- 
cupe une certaine position & sur la droite horizontale OX, en tom- 
bant dans l'intervalle Î[z’, zx”] avec la probabilité 


x” 


P {r' SE<z" Er { e-*%!2 dx 


*) Voir H. O. A. Wold (editor), Bibliography on time series and stochastic 
processes, Oliver and Boyd, Edinburg and London, 1965 (pp. 10-11). 
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x A TA 


-600 Jrajectoires: 


2? 
mms AS 


-800 


Fig. 15. Trajectoires expérimentales 


ha "AE , 
vs , NP 11 Sr 209000 


?. 
Me 


du mouvement brownien de coefficient 


de diffusion 0° = 1. 


(on peut considérer qu'à l'échelle adoptée AV n = 1); en fait la 


bille tombe dans l’un des creux 


Fig. 16. Une partie de la fig. 15 
agrandie de 12 fois. 


divisant l’axe OX en petits inter- 
valles [x,, z:+,] de même lon- 
gueur Ax. 

Si le nombre de billes lancées W 
est suffisamment grand, en vertu 
de la loi des grands nombres le 
nombre , de billes qui tomberont 
dans le k-ième creux [x,, xz:+1l est 
donné par 


Dans le modèle discret, pour une 
valeur fixée £ (s) — a quelconque, 
le mouvement brownien de la par- 
ticule après l'instant s (quand elle 
se trouve au point a) ne dépend pas 


de son comportement avant cet instant. Supposant que cette pro- 
priété se conserve à la limite pour le processus du mouvement 
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brownien continu, on peut trouver la distribution de la variable 
aléatoire t,, l'instant de la première arrivée de la particule brownienne 
au point x= a (tout comme précédemment on suppose qu’à l’instant 
initial £é — Ô la particule se trouve au point z = 0). 

Les lois régissant les déplacements de la particule brownienne 
dans les sens positif et négatif étant les mêmes (dans le modèle dis- 
cret la particule fait un pas à droite et à gauche avec la même proba- 
bilité), les variables +, et t_, (instants d'arrivée aux points a et —a) 
lorsqu'on part du point initial x — Ô ont même distribution. Sup- 
posons que a > 0 et trouvons la probabilité P {tx < t}. 

A l'instant t la particule peut se trouver à droite du point a seu- 
lement si à un certain instant t, < { elle y déjà était (car lors du 
mouvement brownien continu la particule ne peut sauter a). Du point 
de vue formel ceci signifie que l'événement {£ (f) > a} se trouve 
contenu dans l'événement {t, < ?{} et par conséquent 

P{E(t) > a 
PEH>aret= ROZ. 
La probabilité conditionnelle P {E (4) > alt, <t}, sous la con- 
dition qu’à l'instant t, (t, < t) la particule se trouve dans à, coïn- 
cide évidemment avec la probabilité pour qu'après la sortie du point 
a, à l'instant t elle se trouve à droite de a. Mais des considérations 
de symétrie il découle que la probabilité pour la particule de se trou- 
ver à l'instant £ à droite du point initial a est égale à celle de se trou- 


ver à gauche de a et vaut 1. Ainsi P {E (4) > alu <t} = 1}, 
et en supposant pour simplifier le coefficient de diffusion 0° égal à 1, 


on obtient à partir de l'égalité ci-dessus et de la formule générale 
(2.3.9) la fonction de répartition de la variable +, : 


Fra) = P {ra St} = 2P {E(9>a} = 2 | e-#Edr, 150. 
at 1/2 


En dérivant la fonction de répartition par rapport à {, on trouve la 
densité de probabilité correspondante, soit : 


Pa(t) NT t-32e-l4, Lt 00 (2.3.10) 


(px. () = 0 pour { < 0). 
Il est intéressant de remarquer que pour un point quelconque a 
la valeur de 7, est finie avec la probabilité 1 : 


P {Ta << oo} = lim P{ugt}=p/ À \ e-*/? dr 1, 
0 ° 1 


c'est-à-dire qu’une particule brownienne atteindra tôt ou targ-un 
point arbitraire a (à un certain instant aléatoire t, << co). 
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Connaissant la distribution de la variable +,, l'instant d'arrivée 
au point x, on peut immédiatement trouver la distribution du dépla- 
cement maximal d'une particule brownienne pour un temps donné t. 
On a de toute évidence 


P {max£(s) 2x} = P {tx <t}— 
0<s<t 


— C0 ——— © 
— UÆ | ee u=)/ + | eu*;2t qu 
1 nt ’ 

1/ 


par conséquent la fonction de répartition &£ = max £ (s) sera 
0O<s<t 


Fe(a)=1—P {max E (Dr) = V = { e-u/2t qu 


5 2 © 
(rappelons que y = ( eu*/2t dt — Va e—w/2 du = 1) . On voit 


(L 


que la variable £ — max E (s) a pour densité de probabilité 
0< 


OV Zen, 0Lzxr< 00 (2.3.11) 


(pe (x) = 0 pour x << 0, car & > E (0) — a On a obtenu la Loi nor- 
male doublée (il est facile de voir que P{EZ> z} = 2P {E (1) > x}. 


I] est évident que la grandeur min Ë (s) a même loi de répartition, 
0OZs<t 


a savoir 
p(=y/ Let, oo <:<0 


(p (x) = 0 pour x > 0). Il est intéressant de noter que 
P {max £(s) >0}— P {min E(s)<0}=1 


et donc, en partant du point x = O, une particule brownienne se dépla- 
cera durant un temps t aussi petit que l’on veut tant à droite qu'à gauche 
du point x = 0. En étudiant la trajectoire d’une particule brownienne 
dans le temps (c’est-à-dire le graphique de la fonction E = E (4), 
t > 0), on remarque que, pendant un intervalle de temps aussi petit 
que l’on veut (0, #), cette trajectoire continue coupe un nombreinfini 
de fois le niveau x = 0, prenant un nombre infini de fois des valeurs 
tant positives que négatives (autrement dit une particule brownienne 
retournera sans cesse au point initial x = (). 


. La trajectoire E (u), 0 < u < t, d'une particule brownienne qu'on 
suppose continue atteindra son maximum absolu (le premier s’il 
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y en a plusieurs) en un certain point t,0 < tT< 4. Nous allons trou- 
ver la distribution de la variable aléatoire +. 

Supposons que la densité conjointe des variables aléatoires + et 

— £ (t) (6 = max Ë (u)) existe. Montrons qu ‘alors cette densité 


£Lu< 


est de la forme 


1 
Pr, a(s, x)=— TS —e-*#/2s, (2.3.12) 


O<s<t, OZzxz< co. 


A cet effet nous allons considérer tout d’abord la distribution conjoin- 
te des variables aléatoires +, et &, où t, tout comme précédemment 
est l’instant de la première arrivée de la particule brownienne au 
point a > 0. 

Une fois au point a, la particule brownienne obéit aux mêmes 
lois que si ce point était le point initial. Ainsi la variable 5 — 
— max & (u) coïncidant sous la condition t, = s, 0<s< ft, avec 

O<u<t 
le max E (u) possède sous la condition mentionnée ja même distribution 

s<u<t 
que la variable a + max & (x) et en vertu de la formule (2.3.11) 


Ou-:t—xs 


a pour densité de probabilité 


2 a 
PE (z| s) = Vs e—(x-a}/2(t-s), aLrz< ©, 
par conséquent la densité p. x (s, x) de la distribution conjointe 
des variables +t, et & pour 0<s<1t, a r< o s'écrit (voir 


(1.3.17)) 
1  Q-02/280-(x-aP/ At). 


Pa, 85 2) Pre (9) PR GIE 


D'un autre côté, sous la condition & = max Ë (4) = a le maxi- 
0<u<t 
mum de *+ coïncide avec l'instant t, et par conséquent sous la condi- 
tion mentionnée les variables t, t, ont même distribution. Il en dé- 
coule que la densité de probabilité des variables (rt, £) au point t - 
— $, & — a coïncide avec la densité de probabilité des variables 
(t;, £) au même point (s, a), car 


Pr,8(s, a) = p. (s\a) px (a) = pr, (sl) pe (a) = pr, x (s, a), 
où p. (sx) et p., (six) sont respectivement les densités de probabilité 


conditionnelles de + et de t, sous la condition £ = x. La formule 
obtenue ci-dessus pour la densité de probabilité p. ,£ (x, s) permet 


d'écrire pour zx = a: 


Pr, (S a) = —}— + 02/2, OLs<t, 0<a<o, 
a V/s(t—s) $ 
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ce qui nous donne la formule (2.3.12) trouvée ci-dessus. Quant à la 
densité de probabilité de la variable +, l'instant où la trajectoire 
brownienne Ë (s), 0 < s < {, admet un maximum entre 0 et £, elle 


vaut 
| , Pr (s) = | Pr.z(s, x) dx = 
(S}= 
FI TS 0 
| [se] 
| __ 1 | T_ L—x2/2s 
— — ei dr — 
| an Vs(t—s) A ù 
| 
| = pr s<t. 
2 a Vs(t—s) 
Tt | La fonction de répartition cor- 
| respondante sera 
; | : 
A du 
Ê — se 
Ü 3 t $ F(s)= | = Vu (t—u) 
0 


2 . Te 
——— arc sin V’ — 0OSs<t. 


Cette loi de répartition s’appelle la loi de l'arc sinus. Le point du 
minimum de la trajectoire E (s), 0 < s < ?{, a évidemment même 
distribution. On voit sur la figure 17 que le plus probable pour une 
particule brownienne est d’avoir un extremum de trajectoire au voi- 
sinage des extrémités du segment envisagé [0, #]. 


$ 4. Distributions normales et distributions liées 
aux distributions normales 


1. Distribution normale multidimensionnelle. Soit la distribu- 
tion normale de densité de probabilite 


le-sligr, —o<1< 0. (2.4.1) 
27 


Po (x) = 


La densité de probabilité p, (x) étant une fonction paire, on a 


O0 


1_ | ze—**/2 dr =Ù 
V/2x LE 


(c’est-à-dire que la valeur moyenne est nulle). Pour calculer la varian- 


ce 1_ | z°e”**/2dx nous allons utiliser l'intégrale de probabilité 


V'2x 


—œ 


| e*°/2dzx=-1 
© 
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En substituant z Vu à x, pour tous les u >0Oona 


1 [ 210 1 
eux dr = . 
Van Vu 


En dérivant par rapport au paramètre w au point u = 1 on obtient 
pour la variance 


1 


V2x 


Soit E, une variable aléatoire répartie suivant la loi normale 
(2.4.1); comme nous venons de le montrer 


ME, — 0, DE — 1. 


Considérons la variable aléatoire Ë = ©oë, + a, o > 0. Il est facile 
de voir que 


O0 
| ge-rdr=1. 
— 


ME = a, DE = 0°, (2.4.2) 


et la densité de probabilité de & sera 


p(x) = e—(x-0}/26, — oo LZ< 00. (2.4.3) 


210 
Une loi ayant la densité de probabilité de la forme (2.4.3) est éga- 
lement appelée normale (ou gaussienne) ; elle est définie par deux 
paramètres (a, ©), où a est la valeur moyenne: 


O0 


1 | . 
a — ze-(x-a)/20 Jr 2.4.4 
V2ro d ’ ) 
et © est l'écart type égal à la racine carrée positive de la variance: 
D] Â ( eo 9 2] 
O* = ———— z—a)e-@-a}*/20 dx. 2.4.5 
7e JC (2.4.5) 


Pour a = 0, o = 1 la distribution (2.4.3) est généralement appelée 
distribution gaussienne type. 

Considérons nr variables aléatoires indépendantes Es, . .. , Eon 
de mème distribution gaussienne (type). Leur densité de probabilité 
conjointe est 


Po (1 ..., Tn) = 
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Soit 
ñn 


E = à OirEox + di; L — 1, cs À (2.4.7) 


une transformation linéaire régulière des variables E,,, k = 1, ... 
., n. On a évidemment 


ME; — d;, 
Mi—a)(E—a)= 2 OinOjns à j—=1,..., n3 (2.4.8) 


les variables indépendantes Ex, k = 1, ..., n, de moyennes nulles 
étant non corrélées, on a 


MEox = 0, M (Eoxbor) = MEox: MEor = 0 pour k =, 
k, l=1Â,...,n. 


Rappelons que la matrice RÀ = {R,;} d'éléments 
Ryy = Mi —a)(f; — a), i, j =1,...,n, 
s'appelle matrice de corrélation des variables aléatoires E£,, ... 
Rij 
. Enr: = 


üiRjj 
Es, Ej). 11 découle des formules (2.4.8) que la matrice de corrélation R 
dans le cas envisagé est 


est le coefficient de corrélation des variables 


R = o0*, (2.4.9) 


où © = {0;;} est la matrice de la transformation linéaire (2.4.7), 
et o* la matrice conjuguée de © (d'éléments 0%; = ©;;, à, j = 1, ... 
..., A). Les déterminants |R]|et |o| des matrices mentionnées sont 
liés par l'égalité |R| = |o/, |o| étant ici le jacobien de la transfor- 
mation (2.4.7). Pour la densité de probabilité conjointe des variables 
aléatoires E,, ..., &,, on a alors la formule 


j 1 < 
P(x:: ... En) = rer SP À TT D but—an—a)}, 


(2.4.10) 
n 
où » bi; (ti — &;) (x; — a;) est la forme quadratique que prend la 
i, 71 


n 
somme des carrés à x? lors de la transformation linéaire inverse de 


=! 
(2.4.7). Il est facile de voir que la matrice {b;;} de cette forme quadra- 
tique est l'inverse de la matrice de corrélation {R;;}, car la somme des 


n 
Lé Q o Q . 
carrés >, zË devient la forme quadratique 


— 


k= 

n ñn o n na 

2 [2 Ch(t— as) = À i (2 Chicnj) (ti — ai) (5 —a;), 
=1 j= i,j—4 k= 


bn 
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où {c:,} est la matrice inverse de {0;;}, de sorte que 
{bi} = {cir}" {cu;} = Koix} {ox = {R;;} A 


Comme nous l’avons déjà mentionné, la matrice de corrélation {R;;} 
est définie positive: pour ©, ..., €, quelconques on a 
ñn n 
> Rijcic; = M pà ci (Ei— ai)l°>0; 
To J— 2= 
la matrice inverse {b,;} = R-1 possède aussi cette propriété. Pour 
une matrice régulière définie positive {b;;} la formule (2.4.10), 


Fig. 18. Allure générale de la distribution normale bidimensionnelle (de densité 
de probabilité p (x)); sur la figure sont montrées les lignes de section de la sur- 
face : — p(r) par difiérents plans. 


où ||"! est le déterminant de la matrice {b;;} et a, ..., a, sont 
des constantes quelconques, définit une certaine densité de probabi- 
lité (la densité de probabilité des variables E,, . .., &, liées aux va- 
riables gaussiennes type Eos, . .- ., Eon par la transformation linéaire 
(2.4.7) de matrice {0:;}, celle-ci étant la racine carrée de la matrice 


R = {b:;}7). 
Une distribution dont la densité de probabilité est donnée par 
(2.4.10) ainsi que les variables aléatoires E,, . . ., &, obéissant à cette 


loi sont appelées normales (ou gaussiennes) (fig. 18). 

Il est évident que toute transformation linéaire régulière traduit 
des variables gaussiennes E;, ..., £, en des variables également 
Saussiennes My» + + +» Mn Si 

n 
m= À cab, k=—1, ..., UE 
2— 
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la densité de probabilité de la variable n,, . .., n1 est également 
donnée par une formule du type (2.4.10), à savoir 


Pni, …, nn (Yi ... Un) = 


th =, 
en 2R7e XP { 2. 2 bij (yi— ai) (y5— à) } , (24.11) 


i,J=1 


LU 


&= } Cijd j; i— À, .. 
=! 


{5} = {cui}! {dur} {cu} 


et | À? | est le déterminant de la matrice À — {b,,}-! (voir la formule 


(1.1.7)). 
Soient les variables gaussiennes ËE,, E,, . .., &,, proposons-nous 
de trouver la distribution conditionnelle de Ë, en fixant E,, &e, . .. 


+. En 


n 
Introduisons la variable £, = a, + >} cy, (Ex — a), où a, = 


— M £,, k = 0, 1, ..., n, et les coefficients c;, . .., c, satisfont 
au système d'équations linéaires suivant 


D Ryjcn= Ro =... n (2.412) 
HO! 


(£ est la projection de £, sur l’espace de toutes les variables du type 
n 


D cuër, voir (1.4.32)). 


k=1 
La transformation linéaire régulière 


o = Ëo — Nr = En — Ah k = 1, ..., ñn, 


engendre des variables gaussiennes 1b, ...) Mn telles que 
Mnons = 0 pour tous les £ = 1, ..., n, de matrice de corrélation 
10? 0 
= |6 n): 


où ©? = M n; et R = {R;;} est la matrice de corrélation des varia- 
bles ny, - - -» Mn- Il est facile de vérifier que la matrice inverse de 


R sera 
- fo 0 | 
= (0 R</' 
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par conséquent la densité de probabilité des variables gaussiennes 
Nos nr + + Mn S'écrit 


! 
Pno, ni, ---,nn (y; Uis Yn) = Vo ev*/20 x 


1 1 s 
X Ron re XP { 5 D big } . (2.4.13) 
i,2=1 


Comme il est facile de le voir, la relation ci-dessus est le produit de 
la densité de probabilité 


Pno (4) = | . | Pro, n1, --., nn (YU: Uis --.) Un) X 


X dy - + dYn = e-v/20® (2.444) 


1 
V 2x0 
de la variable n, par la densité de probabilité 


Dni, .-.,nn (Y1 .. Un) = | Pro, n:. -.., nn (y, Uts - Yn) dy = 


—o 


n i n 
= nee sp {+ 2 bu} (415 
i, j—=1 
des variables n,, . .., n,. Ceci signifie que 9, ne dépend pas de 
Mir + - + Mn. Par conséquent la distribution conditionnelle de 
(en fixant mm, ..., mn quelconques) a la densité normale py (y) 


indiquée ci-dessus. 
Considérons la variable aléatoire Ë, = no + Eos Où Eo = &o + 


LL) 


+ \ TU ct nn = Er — 0n, k = 1,..., n Comme, pour des 
k 


E, = 2, ..., En = 2% fixés, la variable Ë, diffère de n, d’un terme 
LU 

constant Z5 = do + 2, Cy (za — @&), sa densité de probabilité con- 
k=1 

ditionnelle vaut 


'AMCAETT c.., Tn) = Pro (€ — To) = 


— e—(x-%o)?/20? , —7<xz<<c. (2.4.16) 


V 2rxo 


C'est une densité de probabilité d’une loi normale de moyenne 


©œ LL 


zo=M (EolZis +. Zn) = | 7 NCAETT s.. En) dT = ap + D cata — ax) 


— 00 k=1 
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et de variance 
L 11 
0 p: 2 
O* — M [Eo —ao— © Ch (Ex — ax)] ° 


Nous avons ainsi trouvé la distribution conditionnelle de la 
variable E, pour E,, . .., E, fixés. Nous avons établi en passant que 
des variables gaussiennes non corrélées sont indépendantes ; que si une 
variable multidimensionnelle (Es, E1, . . ., En) à une distribution nor- 
male, il en est de même de la loi d’une variable multidimensionnelle 
(E1, - - -, En) d'un nombre de dimensions moindre, en particulier, les 
composantes E,, ..., &, prises séparément suivent une loi normale 
de type (2.4.3) (comparer avec (2.4.13)-(2.4.15)). 


Il est facile de voir que dans les applications on a souvent affaire 
a des variables aléatoires composées d’un grand nombre d'éléments 
indépendants. Il se trouve que pour des conditions très générales 
de telles variables sommes sont normalement réparties. 

Ce fait fondamental s'exprime mathématiquement dans l'une des 
formes (suivant les conditions) du théorème de la limite centrée (dont 
le théorème de Moivre-Laplace est un cas très particulier). A titre 
d'exemple on peut citer le théorème de la limite centrée pour des 


sommes S, — > £, de composantes indépendantes E,, E, ... 


= 
satisfaisant à la condition de Liapounor : 


E, — ax [5 + O pour n — (2.4.17) 


R=1 


(a, = M Es, & =1,2,...; B, = VDS,); à savoir, sous la con- 
dition (2.4.17), pour la distribution de la somme normée 


«_ Sn—MSn 
FT VDS, 
on a la relation limite suivante *) : 


. 1 
Il << pa ” == 
in, P KE) = 


Notons également que si les variables aléatoires E,, £s, ... 
sont de même loi, pour la fonction de répartition F, (x) = P {Sn < < 
< zx} de la variable SA on a l'estimation suivante ++) de la précision 


| e-*%2 dx. (2.4.18) 


*) Voir plus loin $ 5. 
**) Cette estimation, avec la constante absolue Co << 0,9051, a été récem- 
ment obtenue par V. Zolotarev. 
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de l’approximation normale mentionnée 


nm 
SUP | Fn (x) —® (2) <Co CET 


* 


où D (x) — 7 | e-u*/? du est la fonction de répartition normale, 
AL 


(2.4.19) 


la constante C, n'étant pas supérieure à l'unité 
(u = M lé — af, a =MEt,, o = V DE, k = 1,2, ...). 


2. Estimation des paramètres de la distribution normale. Dis- 
tribution du %° et distribution de Student. La densité de probabilité 
normale est déterminée par deux paramètres : la valeur moyenne a 
et l'écart type ©: 


1 . DINAN 
p(e) = ee oo LE € 00 


(voir (2.4.3)-(2.4.5)). 

Soit une variable aléatoire répartie suivant une loi normale de 
paramètres (a, ©) inconnus. On peut obtenir les estimations statis- 
tiques de ces paramètres. À savoir, si &,. . .., E, sont des variables 
gaussiennes indépendantes de moyenne a et de variance 6, on peut 
estimer l'espérance mathématique inconnue «a (d’après les valeurs 
échantillonnées E,, ..., Ë,) à l’aide de la « moyenne empirique » 


a+ SE. (2.4.20) 


k-=1 


et la variance © à l’aide de la grandeur 


T9 | M To 
= 1 5 ia). (2.4.21) 


R— 1 


En tant que combinaison linéaire des variables gaussiennes indépen- 


n 
dantes E,, . .., E,, la moyenne empirique à — _ à Ex a une distribu- 
tion normale de paramètres a et = (a = Mä, F = D). 
Vr à 


Pour trouver la distribution de la « variance empirique » 6° — 
n 
1 = . us 
= + (Ex — à)? servons-nous de l'identité 
k=1 
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En utilisant une transformation orthogonale quelconque 
des variables E,, ..., E,: 


n 


M4 — à Cu k=1,...,n, (2.4.22) 
J— 
où AT . + A on obtient 
n n n— 1 
= DE-nt-Zni-ni- Z ni, 
j=1 R=1 k=1 


car lors d’ une transformation orthogonale la somme des carrés 


D E; devient la somme des carrés ni. 
j=1 = 


Comme la « variance empirique » 


ne change pas lorsque l’on passe des variables E,, ..., £, aux 
E] — @, ..., En — 4, sans restreindre la généralité on peut consi- 
dérer que la valeur moyenne a est nulle. La densité de probabilité 
conjointe des variables prenne indépendantes Er ..., En Sera alors 


P (ti +. In) = ES n exp { — Hi }, 
et celle des variables 1,, . .., n., obtenues par la transformation 
orthogonale (2.4.22) sera 


1 | 1 à - 
AUTRES Un) = EXP "202. 2 y } 
(voir la formule de la transformation de la densité (2.4.11)). On voit 


que M, - - -+ M Sont des variables gaussiennes mutuellement indé- 
te 


pendantes et donc no° = 2 est la somme des carrés de 7 — 1 


variables gaussiennes indépnantes Mk de paramètres (0, oc). On voit 
également que les estimations envisagées 
n— 1 
. 4 To | e 
G—=—Mn et —— > (2.4.23) 
k=—1 
sont mutuellement indépendantes. 
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La distribution de la variable aléatoire 
= À Eu (2.4.24) 


OÙ Eoys + + -» ëon Sont des variables gaussiennes indépendantes, est 
appelée loi du x carré; n est le nombre de degrés de liberté (fig. 19). 
Cette loi a pour densité de probabilité *) 


p(a)= 1 52-82, 0OSxr< oo, (2.4.25) 


ar (5) 


et se trouve être un cas particulier de la distribution gamma (voir 
(2.2.17)). 


ÿ 10 F1 20 25 J0 JS 40 
Fig. 19. Densités de probabilité de la distribution du 4° à n degrés de liberte 


(n = 1, 4, 10, 20). 


Notons qu’à partir de la formule (2.4.25) on peut facilement obte- 
nir l'expression de la densité de probabilité de la variable aléatoire 


n 
4 = VS Eir égale au module du vecteur (Es1, . - ., Eon), Soit: 
k= 1 


Â 
— 2 D = —______—_——————— 
Px (x) = 2xp (x°) = D2E G) 


pour rz = 2 on a la distribution de Rayleigh, pour nr = 3 la distribu- 
tion de Mazwell. 


alle“, OLz<Lo; (2.4.26) 


Ainsi nous avons établi pour les estimations à, o des paramètres 
inconnus &, © de la distribution normale que à suit une loi normale 


*) La formule (2.4.25) sera déduite dans le $ 5 (voir (2.5.21)). 
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Le 


de paramètres (a, ——) et nË la loi du x* à n — 1 degrés de liberté et 
Vr 


que de plus à et © sont des variables aléatoires indépendantes. 

Si l'on connaît le paramètre ©, pour &« quelconque aussi petit 
que l’on veut on peut indiquer un À tel que la valeur inconnue du 
paramètre a se trouve dans l’intervalle de confiance 

a—TASaLat A (2.4.27) 
Va VAn 
avec une probabilité au moins égale à 1 — «, où A est défini en fonc- 
tion de & par la relation 


P{ 


(on peut trouver À des tables de la fonction de répartition normale 
® (x)). 

Si les deux paramètres (&, o) sont inconnus, les limites de la moyen- 
ne inconnue a peuvent être trouvées à partir de la distribution du 
rapport 


a—a 


Vr]<A}=20(a)—1-1—0 


—_ 
Vie oén | V DAT 
R=—1 


OÙ My, - - - Mn Sont des variables gaussiennes indépendantes de 
paramètres (0, o). 


La variable += n, / 2m n=i Sn ne dépend évidemment 


pas de © et sa distribution coïncide avec celle du rapport 


A 

Eon _—. D'Eo ; pour les grandeurs gaussiennes indépendantes 
j=1 

type Eo1 = _ y +... Bon = 12, Cette distribution est appelée Loi 


de Student (ou loi du t) (fig. 20) : elle est déterminée par le paramètre 
m = n — À et comme nous allons le montrer ci-dessous a pour den- 
sité de probabilité 


r (== 


| ) ( z° ss 


1 V2 7 ) 
PU) = 7 — Fr , Oro. (2.4.28) 
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Tout comme dans le cas de la recherche de Îl’« intervalle de 
confiance » (2.4.27), on peut indiquer la valeur A telle que 


P { Vn=T se A} =P{IT|I<A}=1—0, 


O 


et donc avec la probabilité 1 — « on peut garantir que 
- 6 - c 
1-7 <a <a + — À. (2.4.29) 


Pour terminer nous allons démontrer la formule (2.4.28) pour 
la densité de la distribution du t (densité de probabilité du rapport 


Ds “5 -5 -2 0 1 2 3 4 5 


Fig. 20. Densités de probabilité de la distribution de Student de paramètre 
m — À, 5; le cas de m — © correspond à la densité de probabilité de la distri- 
bution normale type. 


n = Ë1/E, de variables indépendantes, où ë, est une variable gaus- 
sienne de paramètres (0, 1) et E.=— Le avec #* suivant Ja 
loi du 4° à m degrés de liberté). 


A partir de la formule (2.4.26) on trouve facilement que la den- 
sité de probabilité p, (x) de E. est 


m/2 


Pour la densité de probabilité du rapport n = E./E., compte tenu 
de ce que p, (x) = 0 pour z << 0, on a l’expression suivante: 


Pn (y) = | Pi (UT) Pe (x) x dx 
0 


8—0521 
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(voir (1.3.14)). En substituant dans cette dernière relation l’expres- 
sion de p, (x) trouvée ci-dessus et 
1 


Pi (x) = ex, — oo LT 00, 
on obtient 
Pn (y) = Fe amie es dr. 
(7 


En faisant le changement de variable u = Fr z° (1 + L) , On 
obtient finalement 


œ 


Pn (y) are) (1 + hs utm-1)/26-u qu, 
2 


œo 


0 


est la valeur de la fonction gamma au point (m + 1)/2. La formule 
(2.4.28) est démontrée. 


$ 9. Lois de probabilité et fonctions caractéristiques 


1. Fonctions caractéristiques et leurs propriétés. La fonction 
p (4) = Meité, —o0 <'1< 00, (2.5.1) 
dont la valeur au point { coïncide avec l'espérance mathématique 
M eïtt d’une variable aléatoire réelle E s’appelle fonction caractéris- 
tique de cette variable £ (ou de la distribution correspondante de 
fonction de répartition F (x) = P {E < zx}). 
Supposons que la distribution soit concentrée en des points entiers 
œ 
k—0, +4, +2,... (c'est-à-dire Ÿ P(k) = 1, où P (k) = 


R=—00 
= P {E=Rk}, k = 0, +1, +2, ...), la fonction caractéristique 
p(t)= D, et*P(k) (2.5.2) 
R=— — 00 


est alors une fonction périodique (de période 2x) et la formule (2.5.2) 
donne son développement en série de Fourier de coefficients 


bd 
P(E = — À e"thto (+) de, k—0, +1, +2, .... (2.5.3) 


—T 
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Si la distribution admet une densité p (x), la fonction caracté- 
ristique s'écrit 
 (£) = | e*p(x) dx; (2.5.4) 


c'est l'expression de l'intégrale de Fourier de la fonction p (x), 
—00 <<zr< oo, et pour une fonction absolument 


intégrable œ(t) (|1p@idt<o), la densité p (x) peut 


être obtenue par transformation de Fourier inverse : 
pia)=—— | e“lp(t)dt, —oo<r< oo. (2.5.5) 
Nous allons donner la formule générale d'inversion *) reliant la 


fonction caractéristique œ (£) et la fonction de répartition # (x) cor- 
respondante : 


(ol . . 
Â er ist ix"t 
27 — it 

— © 


F(#)—F (2) = lim e-s42/2 p{t)dt, (2.5.6) 


pour des points x’ et x” quelconques où la fonction de répartition 

F (x) est continue (c’est-à-dire P {E = x} = P {& = z”} = 0). 
Notons ici que le nombre de valeurs différentes de z pour lesquel- 

les P {E =zx} > n’est pas supérieur à = et donc le nombre de 


valeurs de x pour lesquelles P {£ = x} > 0 est fini ou dénombrable ; 
puis, pour des zx’, x” quelconques on peut trouver une suite de points 
x, —> zx — 0, x, — x” + 0 satisfaisant à la condition P {E = x;,} = 
=P {E = z,} = 0, alors en vertu de la continuité de la probabilité 
on a 
lim P{r<E<z)}=P{r <E<zr}=F(x)—F(z —0), (2.5.7) 
7 — 00 
ce qui avec la formule d’inversion donne le résultat suivant: une 
distribution de probabilité est déterminée d'une manière univogue par 
sa fonction caractéristique. 


Considérons le développement 


en+i 


n 
th 
ite — Rk 6h n+1 
eite 2 i ri +0 ST tri, 


*) Nous verrons plus loin quelques autres exemples de formules d'inver- 
sion (voir page 124). 


$* 
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une grandeur bornée [0 | < 1. Si les moments finis puy — 
M, k =1,..., n + 1, existent, on a évidemment 


Meitt — > ge Me ME + TT di, 


de sorte que la fonction caractéristique  (£) peut étre développée en 
série comme suit: 


p(t)= D i NP rec dE —oo<t<oo, (2.5.8) 
k—0 
où |A] MIE" et bo= p (0) = 1, 
un == à 4 (0), k—1, 
La formule (2.5.8) permet de calculer les moments u4, = ME" 


d’après les dérivées de la fonction caractéristique de la variable 
aléatoire E. 


Nous allons voir quelques exemples. 
Exemple (loi uniforme). Pour la densité de probabilité 


TH si aZz<b, 
0 si z<a, t>b 


la fonction caractéristique est 
b 


e'tx dr — 
a 


eibt — eiat 


an SSP: 


Exemple (loi de Poisson). Trouvons la fonction caractéris- 
tique de la loi de Poisson 


ak _, 
On a 


Lee 


. LAN . : 
p(= Sel P(k)=e" 2 CD = e-tearit = eueth), (2.5.9) 


— 


octeo. 


E xemple (loi normale). Trouvons la fonction caractéristique 
de la loi normale de densité de probabilité 


p(x)= e-rl2,  —o<r< 00. 
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Lorsque le paramètre z est réel, on a 


Lempto dr | enr a 


© 
—— ei 2 1 | e-(x+:}/2 dx — ez°/2 


CO 
| e—*#/2 dr — e*/?, 
© 


i 
V2 


et l'intégrale Î e“*p (x) dx = e‘*/° est une fonction analytique de 


z avec le prolongement univoque dans tout le plan complexe de la 
variable z. En substituant à z la valeur it on obtient pour la fonction 
caractéristique cherchée 


@ (£) = | eXp(r)dx=e-t"/2, —oo<t< 00. 


—00 


Notons que si l’on a la transformation linéaire & = ©oë, + a, 
la fonction caractéristique œ (£) de & s'obtient à partir de la fonction 
caractéristique œ, (£) de &, à l’aide de la formule 


o (#) = Meïtoite)= eitap, (ot), (2.5.10) 


d’où l’on déduit que la fonction caractéristique de la variable gaus- 
sienne £ de valeur moyenne a et de variance 0°? (£ = oë, + a, où Eo 
est une variable gaussienne de paramètres (0, 1)) est 


q(t) = eitt—0#5/2, — oo Lt< oo. (2.5.11) 


Exemple (loi exponentielle symétrique et loi de Cauchy). 
Considérons une distribution de densité de probabilité 


p(x)}=+e-l, —oo<r< 00, (2.5.12) 


où a est un paramètre positif. La fonction caractéristique est 


2 


7 itx œltx\ ,ax __ 4 a+it)x 4 a— i —_ 
par (tsLeis)esare + [entire dr+ + [etais dr = 
0 0 0 
a { 1 a° 


Notons que pour a — 1 la fonction caractéristique (2.5.13) est 
égale, à un facteur constant près, à la densité de probabilité 


p(n=L(U+a)t, —o<z< 0, (2.5.14) 
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obtenue à partir de la formule générale (2.4.28) pour la distribution 
de Student pour m = 1. Cette densité donne la distribution du rapport 
de deux variables gaussiennes indépendantes de paramètres (0, 1), 
la distribution de la variable tg £, où E est une variable aléatoire 


. ’ 7 ‘ T I . 
uniformément répartie sur le segment [| — TS: z | et certaines autres; 


la distribution de densité de probabilité (2.5.14) s'appelle loi de 
Cauchy. 

En comparant (2.5.12)-(2.5.14) et en utilisant la formule d’inver- 
sion (2.5.5), pour la fonction caractéristique œ (t) de la loi de Cauchy 
on obtient l'expression: 


pO=+ | etr({+a) tar 


2 | eu ({+ut) du |=e-M, —oo<t<oo. (25.15) 
Une propriété importante des fonctions caractéristiques est que 


la somme des variables indépendantes E = EE, +... +E, a une 
fonction caractéristique de la forme 


p (8) = qu () - -. En (), (2.5.16) 


égale au produit des fonctions caractéristiques ®, (4), . . ., a (6) 
des composantes E,, ..., &,, ce qui est une conséquence de la pro- 
priété générale des espérances mathématiques : 


Meité — M (eïtf1 ... eïtèn) — (Meïtñi) ... (Meïtin) 
(voir formule (1.4.6)). 
Exemple (loi triangulaire). Trouvons la fonction caracté- 
ristique d’une loi de densité de probabilité 
1—]x] si |[z|<1, 
p(a) = (0 si |[z|>1, 


coïncidant avec la densité de probabilité de la somme ë = Ë, + E, 
des variables aléatoires indépendantes E, et £, uniformément répar- 
ties sur les segments [—1, 0] et [0, 1] dont les fonctions caractéris- 
tiques sont 

e — 


; 1e 
pÜ=—— et pi) = 
D'après la formule (2.5.16) la fonction caractéristique cherchée est 


P (€) = Pi (Ë) Pa dé USE EU cer, — oo <t<oo. (2.5.17) 
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Exemple (loi binomiale). Trouvons la fonction caractéris- 
tique de la loi binomiale, c'est-à-dire de la distribution de la somme 
E =E, + ... +6, de variables aléatoires de même loi telles que 


e, — 1 avec la probabilité p, 
N 0 avec la probabilité 1— p. 
La fonction caractéristique d’un terme étant égale à (1 — p) + 
+ ep, la fonction caractéristique cherchée s'écrit 
p(t) = [1 + p(eit — 1)]", —oo <'1< 00.  (2.5.18) 


Exemple (loi du x*). Trouvons la fonction caractéristique 
de la variable aléatoire 


= +... +6, 


somme des carrés de variables aléatoires indépendantes de parame- 
tres (0, 1) de densité de probabilité de la forme 


-+2/9 
eTXV+,  — LIT 00. 


Po (x) — = 


La densité de probabilité de chacune des variables EË étant 


1 ' . € 
eu? si 0Ly<o 
p(y)=4 V2w _ ° 


0 si y<0 


(voir exemple de la page 36), la fonction caractéristique d'un terme 
Er est 


O0 


U 0 
—= — Di 1/2 1 ( —l/2e-x —= 
(1 — 2it) = E e-* dx 
= (1— 28)" Eu = ({—2it) "À, (2.5.19) 
T 


car au point !/, la valeur de la fonction gamma est égale à V x. La 
fonction caractéristique de la loi du #° à n degrés de liberté est donc 


pt = (1—2i)-7?, —o<t< 00. (2.5.20) 


Comme pour r > 1 la fonction |œ (ét) |, —co << << 0, est 
intégrable, la densité de la loi du #° pourrait être calculée à partir 
de la formule d'inversion (2.5.5), cependant il est plus simple de reve- 
nir aux expressions figurant dans (2.5.19). Il est facile de voir que 
si dans l'expression initiale pour la densité de probabilité p (y) au 
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lieu de y-!/* on avait y"/=—1, pour un facteur de normalisation conve- 
nable D on aurait 


D | eityw2-ie-ur dy = (1 —2it) "2. 
0 


La fonction caractéristique @ ({) = (1 — 2it}-"” déterminant d’une 
manière univoque la loi du y* correspondante, on en conclut que cette 
loi a pour densité de probabilité 


Pr (x) = TC) ze—le-xl?, 0OSzr< CO , (2.5.21) 
2 T[— 
2 
où le facteur de normalisation D — AC) est obtenu à partir 
an 2p — 
2 


de la condition 
| Pn (x) dx = D | z2—te-x/2 dx — D.2"? | y"2-1e-v dy — 
0 0 0 


= D2"°T (+) — 1. 


Exemple (stabilité de la loi de Cauchy). Soit E,, E+, . . . une 
suite de variables aléatoires indépendantes distribuées suivant la 
loi de Cauchy. La fonction caractéristique de chacune de ces varia- 


bles est (2.5.15) 
p (#) = e’ltl, —oo <'i< 00. 


Considérons la moyenne arithmétique 


n 
Â 
DL 
k-1 


Il est facile de voir que la fonction caractéristique w: (f) de & est 
t\n 
mO=p(+) — e-ltl, 


donc pour »# quelconque la moyenne arithmétique _ > Ex à la même 


; k=1 
loi de répartition que chacune des variables initiales E,, k& = 1, 
2,... . (Notons que les variables mentionnées n’ont pas d'espérance 
mathématique — comparer avec la loi des grands nombres.) 


2. Convergence des lois de probabilité. On dit que la distribu- 
tion des variables aléatoires E,, nr — 1, 2, . .., converge faiblement 
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vers une loi de fonction de répartition F (x) si pour nr —+ 
P {LE <zr'}—F (2) — F (x) (2.5.22) 


pour des points quelconques x’, x”, où F (x) est continue. 
À titre d'exemple on peut utiliser la faible convergence de la 


? 


distribution des sommes normées S* — 


n 
dans les épreuves de Bernoulli vers la loi normale de fonction de 


E -u*/2 du (voir (2.3.6)). 


répartition F (x) = =)" 
A LA 
I1 découle de la relation (2.5.22) que pour tout point de conti- 
nuité de F (x) pour 2 =" = x 
P {E = z} — 0 pour n—> co, 
et par conséquent la convergence faible signifie également que 
PE<E<z}=F; (2) — 
— F; ()—F(x)—F(x) (2.5.23) 


(pour des points de continuité de F (x) quelconques). 

Considérons plus en détail le cas où les variables prennent des 
valeurs entières 4 = 0, + 1, ... Il est évident que dans ce cas la 
distribution limite doit être concentrée aux points entiers (c’est-à- 


dire F (x) = 2 P (k), Y, P (k)= 1) et la relation (2.5.22) est équi- 
+ 


valente à 
P {Ex = k}— P (k) (2.5.24) 


pour chaque # (P (k), k = U, + 1, . .., étant la distribution limite). 

n effet, dans un intervalle fini quelconque {x’, x”} on trouve 

un nombre fini de points entiers et à partir de la relation (2.5.22) 
on a 

P{r'<hez}= Ù Pfn=k} À P(H=F()—F(x); 

x'<R<X" X'<Rk<x” 
d’un autre côté, 4 — e, k + e pour k entier quelconque et 0 € << 1 
sont les points de continuité de la fonction F (x) — 2 P (k). de 


plus P {k—e<SE, Sk+e}=P {E, = k}, par conséquent pour 
une convergence » faible la relation limite (2.5.24) doit être vérifiée. 

A titre d'exemple on peut prendre la convergence de la distribu- 
tion des variables E, désignant le nombre de « succès » dans »r épreu- 
ves de Bernoulli vers la loi de Poisson, lorsque pour # — le 
nombre moyen de « succes » a— np reste constant : 


P En =k}+ Let k 0, 1,... (voir (2.3.4)). 
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Nous allons démontrer quelques théorèmes sur la convergence 
faible des distributions. 

Pour concrétiser les démonstrations. introduisons la variable 
aléatoire £ dont la distribution sera considérée comme loi limite. 
Précisons qu'il s’agit seulement de la convergence en loi, laquelle 
n'entraîne pas nécessairement la convergence des variables E,, 
n =1, 2,.... 


Théorème 1. Si /a suite des distributions des variables &,, nr = 1, 

2, ..., converge faiblement vers la distribution de la variable £, pour 

une fonction continue bornée quelconque u = u (x), —o0 << z << 00, 
on a o 

lim Mu (Ën) =: Mu (6). (2.5.25) 


Ti— 00 


Démonstration. Dans l'hypothèse de convergence faible 
les distributions envisagées sont compactes en ce sens que pour € > Ô 
quelconque on peut trouver un & fini tel que 


P{IEI1<a}>1—e (2.5.26) 


simultanément pour tous les r = 1, 2, .... 
En effet, en prenant un intervalle suffisamment grand [—a,, a,] 


pour lequel P{IEI<&}>1—-— et P {El <<} —+ 


— P {6 | < &} on obtient que pour tous les x (r7 > nr) suffisam- 
ment grands et a >a, la condition (2.5.26) est vérifiée; de plus, 
pour un choix convenable de a la condition (2.5.26) se trouve 
également vérifiée pour tous les r = 1, ..., r, dont le nombre 
est fini. 
Considérons une fonction continue bornée quelconque u = u (x), 

[u (x) | < À. Sur un segment fini [ —a, a] on peut l’approximer d’une 
manière aussi précise que l’on veut par des fonctions en escalier du 
type 

ue (2) U(zr) pOur Zn LT KZ (k—=1,..., AN), 

LT) —= 

° (à pour z<—a,r>a, 
où a = LL ... Liv = a sont les points de continuité 
de la fonction limite F (x) tels que |u (x) — u (x,) | < & pour 


TZ <T LI. En vertu de la condition de compacité (2.5.26) 
on a 


[Mu (6n) — Mu(En) | SM Ju (6) — ue (bn) 1 < 
< KP{IR |>a}+e<(K+te 


pour tous les r = 14, 2, ..., et d’une manière analogue 


| Mu (5) — Mu (6) | < (K + 1) e. 
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Laissant fixe N quelconque, Ia relation (2.5.23) donne 
N 
Mie (En) = 2 u (zx) P {Tr En KT} + 
N 
+ À u (ra) P {ris EL} = Mu @), 


el finalement, quel que soit e>0 pris à l'avance, 
lim | Mu (ën) —Mu E)|<2(A + 1)e, 


ñn— 00 


d'où l'on déduit (2.5.25). 


Théorème 2. Si la suite des variables aléatoires £,, nr — 1, 2, 
converge en moyenne quadratique vers la variable aléatoire £, la ‘distri- 
bution de ces variables converge faiblement vers la distribution de la 
variable limite E. 


Démonstration. Pour & et à aussi petits que l’on veut 
et nr suffisamment grands on a 


P{lb—tl>e)<- MÈRE 6. 


Sous cette condition on a évidemment 
P{r+e<Ei<z'—-e}—-0<P {<E <z}< 
LP{r—e<E<z" +e}+ 6, 


par conséquent pour les points de continuité x’, x” de la fonction 
de répartition F: (x) lorsque e—0ona 


P{<I<r}-6<P(<E<r}< 
LP{r<i<r}+6; 


il est évident que P{r SE, <z'}—P {z EE <Lz’} pour nr — co. 
En utilisant le théorème 2 nous allons démontrer la formule 
d’inversion (2.5.6). 
Considérons une suite de variables aléatoires E, = £ + A,, où 
Ah sont des variables aléatoires indépendantes de Ë, convergeant 
en moyenne quadratique vers zéro et dont les fonctions caractéris- 


tiques 6, ({) sont absolument intégrables, soit | | Ôn (4) | dt << © 
(ce peut être par exemple des variables gaussiennes de paramètres 


(0, o,). où 0, +0; dans ce cas 6, (t) = e-%t*%2, voir (2.5.11)). 
Les fonctions caractéristiques ®, (t) = œ (t)-6, ({) des variables 
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En = ë + À,, où o (t) est la fonction caractéristique de la variable 
ë qui nous intéresse, sont également absolument intégrables. car 
|p (D 1<1 et |, (6) | 1 6, (ë) |. I1 s'ensuit que les variables 
ë, ont des densités de probabilité p, (x) liées aux fonctions caracté- 
ristiques ®, ({) par une transformation de Fourier (voir (2.5.5)): 


{oo 


Î ix 
Pa(z)=-— | el @n (#) dt. 


— œ% 


En intégrant par rapport à x, z' < zx < x”, on obtient 


LT 
P r'enczr)- | Pn (x) dx = —— f { e#*t dx | Pn (C)dt= 


xt ixt 
EE @ (£) a (t) dt, 


Il 
SE 
8 # 
L) 
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et en vertu du théorème 2 
P{r'<E<zr}=lim P {r'<E<z}— 
no 


LE P(t)ôn(t)dt (2.5.27) 


pour des points de continuité quelconques de la fonction de réparti- 
tion F (x) de E. 

La relation limite (2.5.27) est la formule d'’inversion dont la 
formule (2.5.6) est un cas particulier. 


Rapportons-nous à l'égalité de Parseval bien connue dans la 
théorie des transformations de Fourier : 


1 


27 


esqu(t)qe(#) dt= | pilz—y)pe(y)dy,  (2.5.28) 


| 
g —8 


où pP, (x), Pa (x) sont des fonctions absolument intégrables et Pi. (2), 
+ (4) leurs transformées de Fourier (données par la formule géné- 
rale (2.5.4)), on suppose de plus que le produit œ@ ({) = œ, (ft) > (4) 
est également une fonction absolument intégrable. 

Nous allons nous arrêter brièvement sur la démonstration de 
l'égalité (2.5.28). Comme il est facile de le voir, q, (£) æ. (t) est la 
transformée de Fourier de Ja convolution p (x) = 
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— À p (x — y) pa (y) dy: 


— 


( ets | ( Pa (Z — y) Pa (y) dy | dx = 


—œo 
Le) 


= ( eitu[ | ep (x — y) dr | Pe (y) dy = 


= Pi (6) | e"Vp, (y) dy = Pi (t) Pa (t), 


alors sous la condition d’intégrabilité absolue de la fonction œ (t) = 
— (3 (£) pe (t) l'égalité (2.5.28) n’est rien d'autre que la formule 
(2.5.5) pour la transformation de Fourier inverse. 

La transformée de Fourier q (t) de la fonction réelle p, (x) est 
telle que æ:(—1) = pe (t) et l'égalité de Parseval peut s'écrire 
sous la forme suivante : 


Jette | p(2+ y) pe (y) dy, 


23 
— œ — © 


d'où pour z = 0 pour p, = ps = p et p, = p. = p on obtient 
l'identité de Plancherel 


[eo 


H Jiota= |Ipia (2.5.29) 


CO — 00 
O0 


(on suppose que | | p (t) dt oo). 


En vertu de l'identité de Plancherel, la distance moyenne qua- 
dratique 


1 
4 O0 


In@)—p@l=]/ | inter: Fdr 
entre les fonctions p, (x) et p, (x) ne diffère que d’un facteur cons- 
tant de la distance du même type pour leurs transformées de Fourier 
1 (£) et œe (£); notamment, en posant dans la formule (2.5.29) 
p (x) = Pa (x) — pa (2) et (ti) = qi (€) — pe (), on obtient 


J'imto—pe(n dr | Im—qtid. (25.30) 


En utilisant ce fait démontrons l’assertion suivante. 
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Théorème 3. Une suite des distributions de fonctions caractéristiques 
On (£), n = 1, 2, ..., converge faiblement vers la distribution de 
fonction caractéristique w (t) si et seulement si 


On ()— p(i) pour n —+ 0 (2.5.31) 


uniformément par rapport à t dans tout intervalle fini. 


Démonstration. Supposons qu'il s'agisse des distribu- 
tions des variables aléatoires E,, n = 1, 2, ..., convergeant 
faiblement vers la distribution de la variable aléatoire E. En se  réfé- 
rant à la démonstration du théorème 1, il est facile de voir que pour 
des fonctions continues u (x) = e!* (où le paramètre £ varie dans 
un intervalle fini quelconque |{ | T)jona 


Pn ({) = M eitèn —> Meitt = œ (+) 
uniformément par rapport à é, car 
jet — x, LCIz—x | k=1,...,N, 


où la constante C ne dépend que de 7. D'un autre côté, si la condition 
(2.5.31) se trouve remplie, en employant de nouveau le procédé 
utilisé pour démontrer la formule d’inversion (2.5.27), on obtient 
pour les variables aléatoires n, = &, + A et n = E + A de fonc- 
tions caractéristiques 4, (£) — a (t) Ô (£) et 1 (£) = œ (t) Ô (t) (où 
Ô (t) = e”%*"*/= est la fonction caractéristique de la variable gaussien- 
ne À indépendante de E, et Ë) la relation 


(Ibn @) — 1 (9 Fat = | Lg () — p (0) F6 (dt + 0 


pour 7 —+ co, 
car pour € >> 0 quelconque on peut trouver un 7° tel que 


| Im()—p(P8(4°a<2 é(#)dt<e, 
ItI>T LtT>T 
et pour ®, ({) —>  (t) uniformément par rapport à #4, |[{|<T 


T 
| | Pn (£) — p (#) [* 8 (#)° dt + 0. 
—T 


Par conséquent, pour les densités p, (x) et p (x) des distributions 
des variables n, et n on a 


( | Pr (2)— p (x) P dr = +2 Hb n (9) — (+) dt + 0, 


— © 0 


1 
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ce qui entraîne la convergence faible de ces distributions, c’est-à-dire 
que pour un intervalle fini quelconque [z’, x] 


x” x” 
P{r<mer}= | pindz | p(rdr=P{r'<ner"}. 


Il est facile de voir que comme n, = &, + A et n = E + A diffe- 
rent en moyenne quadratique des variables initiales &, et E d’une 
grandeur & = V MA° aussi petite que l’on veut, il y a convergence 
faible également pour les distributions des variables E,, n = 1, 
2, ... (voir théorème 2), ce qu'il y avait lieu de démontrer. 


Pour conclure nous allons démontrer le théorème de la limite 
centrée sous la forme suivante. Soit 


Sh = À En, n=1, 2, -.., 
R=1 


une suite de sommes de variables aléatoires indépendantes E,,, 

k — 1,..., n, telles que ME, = 0, of, = MEi, —> 0 pour nr —+ 
n 

(uniformément par rapport à k) et à of, = 1. En vertu de la condi- 
k=1 


— 
—— 


tion de Liapounov 
D MI|Exn|—0 pour nr —+ 0 (2.5.32) 
R-=1 


les distributions des variables S%, n = 1, 2, ..., convergent faible- 
ment vers la distribution normale, à savoir 

x” 

| e—<*/? dx 

x’ 

. (comparer avec (2.4.17) où figurent les variables E,, = (E, — a,)/B,, 
k = 1, 2, ...). 

Nous allons démontrer cette assertion en utilisant le théorème 3. 
Démontrons notamment que les fonctions caractéristiques , (t) 
des variables S? convergent vers la fonction caractéristique œ ({) = 
= e”#/2? de la distribution normale type. 

Pour les fonctions caractéristiques :, (t) des composantes indé- 
pendantes E,, en vertu de la formule (2.5.8) on a 


lim P {x <Sa<2x”} — 1 


fn — 00 an 


On 2 Rhin 3 
2 + 6 l 


Pan (£) = 1 — 


Où |Ryn | SM l'Enn PP. Comme oin—>0, Rin—> 0 pour nr —+ 0 
uniformément par rapport à *, on a Œ@zn ({) — 1 uniformément par 
rapport à k et { dans chaque intervalle fini; en particulier, 
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| Pan (#) — 1 <+ pour des r suffisamment grands et on peut 
alors parler du logarithme des fonctions ®;, (t). Pour ®, (t) = 


n 
= [] Prn (£) lorsque n—> 0 On a 
k=1 
n 


In , (t) — D In Pan (é) — 
hk=1 


_S In (1 —Ÿ p4 Fin pe 


k=1 


TNA 


1 
7 3 
Lt” t t° 
= TH Ra) se 
Rk=1 


uniformément par rapport à { dans chaque intervalle fini, car sous 
la condition (2.5.32) on a 


È rie Ë mir p--0 


Par conséquent, pour 7 —+- 
Pn (4) —+ e° 


uniformément dans chaque intervalle fini, ce qu'il y avait lieu de 
démontrer. 


CHAPITRE IIT 


MODÈLES DE PROCESSUS ALÉATOIRES 


$ 1. Définitions et exemples 


1. Définition générale d'un processus aléatoire. En règle généra- 
le, il s’agit d’un processus aléatoire lorsqu'une certaine grandeur 
aléatoire E (£) varie dans le temps é. On appellera donc processus 
aléatoire E = E (t) une fonction du paramètre réel £ € T dont les 
valeurs £ (£) pour chaque t sont des variables aléatoires. 

Les lois que suit un processus aléatoire E (4), £ € T, se déterminent 
par les distributions simultanées des probabilités de ses valeurs 
E (41), ..…, Et) pour différents 4, :.., & (elles sont appelées 
distributions de dimension finie du processus aléatoire envisagé). 

À titre d'exemple, on peut citer les distributions gaussiennes de 
densité de probabilité (voir (2.4.10)) : 


+ Pts, tn (Lis ….s Tn) = 


= ne SP {5 D bule—A(a)le—A4(t)1}, 
1 


k, J— 
où À (41), ..., À (#,) sont les valeurs de la fonction 


appelée valeur moyenne du processus aléatoire & (£), £ E T, la matrice 


de corrélation B = {B (t4,, t;)} étant formée par les valeurs de Ia 
fonction 


appelée fonction de corrélation de ce processus (rappelons que les coef- 
ficients b4;, k, j = 1,...,n, dans l’exponentielle forment une matri- 
ce {b;;} inverse de celle de corrélation {B (f;, t;)} des variables aléa- 
toires & (41), . . ., & (4)); le processus aléatoire & (£), & € T, à distri- 
butions gaussiennes de dimension finie est également appelé gaus- 
sien. 


Chaque valeur E(£) du processus aléatoire, en tant que variable 
aléatoire, dépend formellement de l'issue élémentaire © : E (t) — 


9—0521 
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— £ (wo, t). En considérant le processus aléatoire Ë (4), t € T, nous 
avons affaire pour chacune des issues aléatoires w à une fonction 
correspondante E(w, -)—E(w, t) du paramètre 1€ T, appelée trajectoire 
ou réalisation du processus aléatoire étudié. Observer réel- 
lement un processus aléatoire c’est observer en fait l’une de ses tra- 
jectoires éventuelles zx = z(t), tE€T. 

On peut imaginer un certain ensemble X de toutes les trajectoires 
possibles x = z(t), tET, et un certain % récanisme du hasard » 
susceptible de choisir l’une de ces fonctions x € X. Le choix aléatoire 
de telle ou telle trajectoire z = x (t)},t € T, de X peut être considéré 
comme une issue élémentaire. Rappelons que nous avons précédem- 
ment exposé ce point de vue relativement aux variables aléatoires 
(une variable aléatoire à 7 dimensions peut être considérée comme 
une fonction aléatoire £ ({) du paramètre £, celui-ci prenant un nom- 
bre fini de valeurs #4 = 1, ..., n). Nous avons notamment souligné 
que lorsqu'on considère les variables [E (1), . .., E (n7)], l’espace X 
à r dimensions des vecteurs z = {x (1), ..., x (n)] peut servir de 
celui des issues élémentaires en estimant comme issue élémentaire 
la valeur x = [x (1), ..., x (n)] que prend au hasard la variable ob- 
servée £ — [E (4),...,E (n)]. Dans ce cas, le « mécanisme du hasard » 
correspondant est en fait donné par la distribution simultanée des 
variables [E (1), ..., E (n)l. 


2. Processus aléatoires markoviens. Un processus aléatoire E — 
= E (t) est dit markovien si à tout instant u, pour une valeur E (u) — 
— zx fixée (quel que soit x), les variables aléatoires E (t), t > u. ne 
dépendent pas de £ (s), s < u. Si l'on convient de considérer E (4) 
comme un état de phase d’un certain système physique à l'instant ft, 
le processus markovien £ = Ë (t) décrivant l’évolution du système 
étudié peut être caractérisé plus concrètement de la manière suivante : 
le comportement du système après un instant w quelconque pour un 
état x — E (u) donné ne dépend pas de son comportement antérieur 
à cet instant. 

La propriété caractéristique des processus de Markov se révèle 
distinctement sur l'exemple d’un jeu d’enfants bien connu, dans 
lequel chaque joueur déplace son pion d’un point à un autre suivant 
le résultat amené par le jet d’un dé. Par exemple, si après le n-ième 
pas le pion se trouve au point E (n) = i, alors le passage au point 
E (nr + 4) lors du pas suivant est défini par le nombre de points 
apparus sur le dé. A partir de tout point i le pion lors du passuivant 
passe avec la probabilité p;; dans le point ÿ correspondant. Il est 
facile de voir que le processus aléatoire de changement d’état Ë (7) 
dans le « temps » x = 0, 1, 2, ... est markovien (au lieu du temps 
réel on a ici le nombre n de transitions effectuées ; on peut admettre 
conventionnellement que chaque transition se produit par unité 
de temps). 
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Exemple (mouvement errant). Considérons le mouvement errant 
d’une particule sur les points entiers de la droite réelle. À chaque 
pas, cette particule se déplace d’une unité à droite avec la probabi- 
lité p et d’une unité à gauche avec la probabilité q = 1 — p. Soit 
E (n) la position de la particule après r pas. La suite & (0), & (1), 
E (2),... est markovienne, c’est-à-dire que si la particule se trouve 
en un certain point i, son comportement ultérieur ne dépend pas des 
circonstances précédant son arrivée au point ë, par conséquent, 
dans les n pas suivants cette particule passera avec la probabilité 
Pis (n) dans les états j correspondants. 

I1 est évident que pour | i — j | >> n la transition de à en j est 
impossible et dans ce cas p;; (n) = 0. Il est également évident que 
dans n pas la particule peut passer seulement dans les états j pour 
lesquels la différence | i — j | a même parité que n, c'est-à-dire 
que le nombre 
n:-|j—il 


m = 


est entier. L'arrivée dans l’état j, pour j > à, est possible si et seule- 


ment si de tous les nr pas exactement m — 1 ) pas s’effec- 


tuent dans le sens positif. La probabilité correspondante est (voir 
(2.3.1)) 


Pin) = Cip"g, j > i. (3.1.1) 


D'une manière analogue on exprime la probabilité de transition de à 
en j pour j < à: 
Pis (nr) = Cp" q", j Ki. 
Exemple (désintégration radioactive) (voir pages 83, 85). 
Tout comme précédemment nous allons considérer que chacun des 
atomes de Ra, indépendamment des de antérieures, se 


transforme avec la probabilité p (it) = e"M (A = 2° où T7 


L 


est la période de demi-vie) dans Pnturvalle de temps en un atome 
de Rn. Le nombre total v (t) d’atomes de Ra en désintégration dans 
l'intervalle {, égal au nombre de particules « émises dans le même 
intervalle, est alors réparti suivant la loi de Poisson: 


P{(=m= let, k=0,1,2,..., 


où a = np (t), n étant le nombre initial d’atomes de Ra. Le nombre 
d’atomes de Ra restants sera E (£) — n — v(t). Si l’on connaît la 
quantité de radium à un certain instants: E (s) = à, alors indépendam- 
ment du caractère du processus de désintégration précédant l’ins- 
tant s, k particules & seront émises dans, l'intervalle de temps com- 


pris entre s et £{ avec la probabilité et, a = ip(t —s). Ainsi 


9% 
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E (t) est un processus aléatoire markovien et la probabilité de tran- 
sition de l’état E (s) = à à l’état E (1) = j (t > 5) est 


ai) 


Puft—s)=T=Te", a—=ip(t—s), ji (3.1.2) 


(pour j > à, la transition de à en j est impossible). 


Exemple (processus de Poisson). Considérons un flux pois- 
sonien dans lequel le nombre d'événements dans un intervalle de 
temps (s, t) quelconque ne dépend pas du nombre d'événements réa- 
lisés avant l'instant s (voir (2.2.5) et la suite). Il est évident que 
le processus aléatoire de la variation de E (t), nombre d'événements 
réalisés avant l'instant { en cours, est markovien, la probabilité 
de transition de l’état E (s) = à dans l’état & (4) = j (>> s) étant 


put re, 12 (3.1.3) 


(pour j << à, la transition de à en j est impossible). 


Exemple (mouvement brownien). Le processus du mouvement 
brownien a été décrit au chapitre II, $ 3, p. 2. Cette description mon- 
tre (surtout si l’on se réfère au modéle discret) que le déplacement 
d’une particule brownienne d’un état E (s) = zx quelconque ne dé- 
pend pas de son comportement avant l'instant s (dans le modèle 
discret elle passe avec une même probabilité lors du pas suivant dans 
l’un des états x + Az, x — Ax), et la distribution de la variable 
E ({), coordonnée de la particule brownienne à l'instant { > s, sa- 
chant que & (s) = x, a pour densité de probabilité 


1 e—(u-x)3/2(1-508 oo << y << 00. 


p(t—s,x, CE vx meurs PS 
(3.1.4) 


Considérons le processus aléatoire markovien £ = E (t) en suppo- 
sant, comme il a été convenu précédemment, qu’il décrit le compor- 
tement d’un certain système physique dans le temps t et que E (4) 
est l'état de phase de ce système à l'instant £. 

Supposons que l’on ne dispose que d’un nombre fini ou dénom- 
brable d'états de phase différents. Si à l'instant s le système est 
dans l'état E (s) — x, alors après le temps { — s il tombera dans tel 
ou tel état y avec une certaine probabilité que nous désignerons 
P (s. x, t, y); remarquons que pour un processus de Markov la pro- 
babilité mentionnée ne dépend pas de son comportement avant l'ins- 
tant s. De façon formelle, P (s, x, t, y) désigne la probabilité condi- 
tionnelle pour que E (4) = y, si E (s) = x, s < t. On peut dire que 
P (s, x, t, y) est la probabilité de transition du système pendant le 
temps { — s de l’état x, où il se trouvait à l'instant s, dans l’état y. 
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Généralement, dans le cas d’un espace quelconque d'états on 
introduit les probabilités de transition P (s, x, t, B), probabilités de 
passage de l’état initial x — & (s) dans l’un des états y de l’ensemble 
mentionné d'états B après l'intervalle de temps £{ — s (P (s, x, t, B) 
est de façon formelle la probabilité conditionnelle pour que Ë (1) € B 
sous la condition E (s) = x, s < t). Par exemple, si l’ensemble des 
états est fini ou dénombrable, on a: 


P(s,z t, B)— >» P(s; z t, y); 
vEB 


si E (1) est un vecteur aléatoire dans l’espace £” à nr dimensions et 
sa distribution sous la condition E (s) = za pour densité de probabilité 
p(s, x, t, y), y E E”, on a alors 


P(s,z,t, B)— | P(S, Z, tx y) dy 
B 


(la densité de probabilité conditionnelle p (s, x, t, y), y € E”, est 
généralement appelée densité de probabilité de transition du processus 
markovien E = E (6)). 

Les probabilités de transition P (s, x, t, B) d’un processus marko- 
vien dans un espace vectoriel £”" à nr dimensions donnent en fait les 
distributions des accroissements E (f) — E (s) pour E (s) = x fixé; 
notamment, si l’on désigne par B + x l’ensemble des points y € E” 
tels que y—zxE€B, alors si E (s) = x, on a E (£) — E (s) E B avec la 
probabilité P (s, x, t, B + x). Il y a lieu de noter à cette occasion 
une classe importante de processus aléatoires à accroissements indépen- 
dants, tels que Ë (t) — E (t,) soient indépendants des variables E (s), 
s < t, (quels que soient s < 4, Lt). A titre d'exemple de ce type de 
processus unidimensionnels on peut citer le processus de Poisson 
ou le mouvement brownien qui nous sont bien connus. 

Un processus markovien E = E ({) est homogène si la loi de son 
comportement dans tout intervalle (s, £), sachant que Ë (s) = x, ne 
dépend pas de la disposition de l'intervalle (s, £) sur l’axe des temps; 
pour les probabilités de transition P (s, x, t, B) ceci ne signifie 
réellement qu'une dépendance de { — set non des et de £{ comme dans 
le cas général, c’est-à-dire : 


Ps, z.t, B)=P(t—s, x, B) 


(dans les exemples donnés les processus markoviens sont tous homo- 
gènes). 

Naturellement, le sens de la définition ne dépend pas de désigna- 
tions que l’on pourrait changer pour simplifier les notations (comparer 
avec les probabilités de transition dans les exemples (3.1.1)-(3.1.3) 
ou la densité de probabilité de transition dans l'exemple (3.1.4)). 
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Dans les exemples étudiés ci-dessus tous les processus markoviens 
sont rigoureusement markoviens, ce que l’on peut grossièrement 
décrire comme suit: le comportement ultérieur du processus, après 
son arrivée dans tel ou tel état z (pour z donné), ne dépend pas de 
son comportement antérieur (processus sans mémoire). Nous allons 
préciser cette définition en nous basant sur la notion d’instant aléa- 
toire indépendant du futur. C’est ainsi qu’on appelle toute varia- 
ble + dont on peut univoquement dire d’après la trajectoire E (s), 
st, pour tout { sit < tou t>4t (Test également appelée instant 
markovien). À titre d'exemple de variables indépendantes du futur 
on peut citer l'instant + de la première arrivée dans l’état x et en 
général celui de l’arrivée dans un certain état z donné après un ins- 
tant markovien 1, quelconque. Pour préciser nous allons donner un 
exemple de l’instant aléatoire t dépendant du futur et non marko- 
vien, à savoir t = 1, si l'instant 7, de la première arrivée dans un état 
x quelconque après #4, ‘est inférieur à 4 =, + h, et tT=71t —h 
si  >t,; il est évident que d'après la trajectoire E (s), 4 << S<t, 
on ne peut pas généralement dire si T<£ (c’est-à-dire t, < { + h) 
ou non. On dit que le processus E = E (4) est rigoureusement marko- 
vien si pour tout instant markovien 7 tel que £ (t) = x, où zest un état 
donné, son comportement pour { > t ne dépend pas de celui anté- 
rieur à l'instant +, la transition de x = E (x) dans tel ou tel état 
y après le temps À ayant les mêmes probabilités que dans le cas de 
l'instant t = s fixé, plus précisément, la probabilité conditionnelle 
de tomber après le temps À dans l’ensemble B est égale à P (x, zx, 
r + h, B), où P (s, x, t, B) est la probabilité de transition du proces- 
sus markovien étudié. 

Dans la suite nous supposerons partout que le processus marko- 
vien E = £ (t) est rigoureusement markovien. 


$ 2. Chaînes de Markov. Classification des états. 
Distributions stationnaires 


1. Probabilités de transition. Comme il a été convenu précédem- 
ment, lorsque l’on considère le processus aléatoire £ — E (£), il 
s’agit d’un système dont l’état de phase à l'instant t£ est & (4). 

Soit £ (t), 4 > 0, un processus markovien homogène à un nombre 
d'états fini ou dénombrable pour lesquels on peut prendre les nom- 
bres naturels à = 1, 2, ... 

Supposons que le paramètre { ne puisse prendre que des valeurs 
entières { = 0, 1, 2,...; on a alors une chaîne de transitions: 


E (0) —E (1) + E (2) —... 


Le processus E — E (ft) du type décrit est généralement appelé 
chaine de Markov. 
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Supposons que les probabilités de transition p;; du système de 
l’état à à l'état j pour un pas soient données, en d’autres termes les 
probabilités d’avoir le système dans tel ou tel état j = 1, 2, ..., 
sachant qu’au pas précédent il était dans l’état à, soit: 


pi;= P{E(n)=j|£(n—1)=i} 
(Spy; i—1, 2, ..….). 


Supposons également qu'à l'instant initial le système avec la 
probabilité correspondante p}, pi = 1, se trouve dans l'un des 


états à (en particulier, si pi = 4, p, — 0 pour k Æ i, ceci signifie 


des états À — 1, 2, ..., et la probabilité du système de se trouver 
dans l’état k sera désignée par p4 (n — 1). Si le système après z — 1 
pas se trouve dans l’état k, la probabilité de l’avoir après z pas dans 
l’état j est égale à la probabilité p,; de transition de k en j. En utili- 
sant la formule de la probabilité totale on obtient que 


PE()= = P{E(n)=j|E(n—1)= 4} P {(n—1)=k}. 


Ce qui pour les probabilités p;(n), j = 1, 2, ..., donne les rela- 
tions de récurrence suivantes: 
P; (0) = pis pin) = à Pa(n—1)-pay (n=1:2,...). (3.2.1) 
Si à l'instant initial le système se trouve dans un état à donné, 
la distribution initiale est p? = 1, ph = O0 pour À Æ ài, et la proba- 
bilité p; (nr) coïncide avec la probabilité p;; (7) pour que le système 
dans nr pas passe de l’état à à l’état j: 


pis(n) = P {E(n) =j16(0) =i}, à, j = 1,2, ... 
A une distribution initiale du type pi = 1, pi —0 pour 4 Æi, la 


formule (3.2.1) donne les relations suivantes entre les probabilités 
de transition pi; (n), à, j = 1, 2, ...: 


Pi; (0) — 


1 pour j — à, 
= Z Pi N— 3.2. 
0 pour j Æi; pt, (n) > Pix (n— 1) Puj ( 2) 


(n = 1,2, ..….). 


Il est commode d'introduire la matrice P (n) = {p;i;(n)}. En 
vertu de la formule (3.2.2) on a 


P(0)=17, P(H)=P,P(2) = P(AH)P = P°,..., 
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où J est la matrice unité, P = {p;;} celle des probabilités de transi- 
tion. On voit que l’on a l’égalité suivante: 


P (n) = P* (n =0,1,2,...). 


Connaissant les probabilités de transition p;;(n) (voir (3.2.1), (3.2.2)), 
il est également facile de déterminer les distributions de dimension 
finie de la chaîne de Markov envisagée. A savoir, quels que soient 
les instants n, < ne L... < ni et les états ë,, ie, . . ., ip, à condi- 
tion que E (n,) = ë,, ..., Ë (nx-1) = ir, la probabilité de se trou- 
ver à l'instant 7, dans l’état i, est égale à Piyiin (PR — Npy), 
autrement dit: 
P{E (rm) — li ._ …) ë (73) — lk | & (rm) — li ....) E (7-1) — 
— ix1} — Pipir (ny — Rr-1) 
d’où 
P{E Ga) = à, -.., 8 (u) = à} = 
= PE (nn) = do... Enr) = in1}" Pis sin (rx — nr), 
et d’une manière analogue, 
P {Gu)=ù, ..., E(nns) =irx1} = 
= P{ËGu) =, -.., E(nre) ère} pi, 5, (us — ns), 


Finalement on obtient la formule suivante: 
P {E(r:) = ù, E(ne) = te, ..s E (rx) = in} = 
= pi, (ru): pii, (Re —ns)e ... pi (Ra — nn). (3.2.3) 


Considérons un processus de Markov homogène E = E ({) dont 
les états changent dans le temps continu #, & > 0. Désignons par E, 
l'état de rang net par 7, l'instant d'arrivée à l’état E, (autrement dit, 
th est le temps antérieur à la n#-ième transition E,_;, —+ E,. n = 
= 1, 2,...); posons t, = (0. 

Il est clair que l'instant t, ne dépend pas du futur, de plus, 
grâce au fait que le processus initial & (£) est rigoureusement marko- 
vien, le processus des transitions d’un état à l’autre, décrit par la 
chaîne 

Éo 7 E 7 Ë2..., 
est une chaîne de Markov. Nous allons trouver les probabilités 
de transition x,; de cette chaîne markovienne &, = E (t,), nr = 0, 1,... 

Pour cela, trouvons tout d’abord les distributions des variables 
Tn+1 — Tn pour chacun des états possibles E, — 1, 2, . .. Le proces- 
sus E — E (4) étant homogène, si E, = à, la distribution de t,,, — 7% 
est la même que celle de t = 7, pour le même état initial ë = £, 
(t n’est autre chose que le temps précédant le changement de l’état à). 
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Le processus E = E (£) étant sans mémoire, son comportement 
après l'instant Tt,, quel que soit i — E (t,), ne dépend pas de son 
passé et, en particulier, la durée t,,, — 7, de séjour dans l’état i — 
— E (tx,) ne dépend pas des variables t,,, — T,, k < n — 1 (il est 
d’ailleurs aisé d’en déduire que les différences t,;, — T, mention- 
nées, nr = 0, 1,..., sont des variables aléatoires indépendantes). 

Supposons qu’à un instant s quelconque le processus se trouve 
dans un état donne à (E (s) = i). Considérons le temps + (après l’ins- 
tant s) précédant l'instant de changement de cet état à. Si T1 
et, en particulier, si l’état du processus à l’instant s, = s + t est le 
même: E (s,;) = à, alors le temps 7, (après s,) précédant le change- 
ment d'état a la même distribution que 7, car en raison de l'homo- 
généité du processus son comportement après l'instant s, suit les 
mêmes lois qu'après l'instant s (dans les deux cas à est l’état ini- 
tial). Cela signifie que 


P{r>u+ulE()=i tT>u}=P{u>vlE(s) =i} = 
=P {t>vlE(s = i}, 


car l'événement {E (s) = à, t > u} contient l’événement {E (s,) = i} 
et si Ë (s,) = à, le comportement du processus de Markov E (4) ne 
dépend pas de son comportement avant l'instant s,. Tout comme dans 
la démonstration de la formule (2.2.8) il vient que le temps + d'attente 
du changement d'état a une distribution exponentielle 


P{rt>t|E() =i}=e#, 14>0, (3.2.4) 


où À; est une constante non négative (1/4; = Mt est le temps d’at- 
tente moyen); la constante },; est appelée densité de probabilité de sor- 
lie de l’état i. 

Pour À; = 0, le processus Ë (t) reste toujours dans l’état i; on 
dit d’un tel état qu'il est absorbant; pour 0 << À; << co, la probabi- 
lité de changement de l’état à dans un intervalle de temps petit 
At est 

À At + o (At), (3.2.5) 


où o (At) est un infiniment petit d'ordre supérieur à Af, At —+ 0. 

Revenons aux probabilités de transition n,; et supposons que la 
transition du processus Ë (4) de l’état à à l’état j (j = à) dans un in- 
tervalle de temps petit At soit 


À; At + 0 (Aë), 


où o(At)}/At—+0, pour At—+0. 

Si la densité de probabilité de sortie À; est nulle (l’état à est 
absorbant), le système après être tombé dans à reste pour toujours 
dans cet état, c’est-à-dire que x;,= O pour tous les j Æi; si par 
contre À; 0, le système avec la probabilité 1 sortira de l’état à 
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après un intervalle de temps fini t (rappelons que P {t<1t} = 
=1—e "it Sir=t,onat(t)—iet la probabilité de transition 
dans l'intervalle (£, & + Af) sera par hypothèse À,; At + o (At); 
par conséquent, la probabilité inconditionnelle x;; ({, t + At) d’une 
telle transition est 


sut, tH+At)=[h;Nt+o(At]-P {T>8) = [h;jAt + o(At)] eh, 


Après la partition du demi-axe 0 £<< oo par les points £ = kAt, 
k = 0, 1, ..., on a 


su, = >, su; (kAt, (k+ 1) At) = 


k=0 
= S'[ujAt+o(Atje "ta, | ehtdt, 
k=0 0 
d'où l’on obtient 
su; = hu | etdt= Hi, jÆi (3.2.6) 
0 


(Rappelons que nous considérons le processus Ex = E (t;), nr = 
= 0, 1,. des transitions successives dans lequel chaque état 
suivant j diffère du précédent i, de sorte que x, = 0 


2. Etats récurrents et non récurrents. Considérons une chaîne 
de Markov avec les états 1, 2, ... et les probabilités Pi; (n) de 
transition dans n pas de l'état i à à l'état jiù, j = y... 

Supposons qu'à l’état initial le système se trouve dans un certain 
état i. Désignons par v, la probabilité pour que le système retourne 
pour la première fois dans l’état initial & après exactement nr pas. 
La valeur 


est la probabilité pour que le système à un pas quelconque 7 — 
= 1,2,... prenne l’état initial ë, autrement dit v est la probabili- 
té de retour en i. 

On dit que l’état à est récurrent si la probabilité de retour en cet 
état est égale à 1 et non récurrent si cette probabilité est inférieu- 
re à 1. 


Théorème 1. L'état i est récurrent si et seulement si 


S Dii (n) — O0. (3.2.7) 
n—1 
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Démonstration. On a l'égalité suivante: 
Un = Un + Un +... + ut + wo, n = 1,2,. .., (3.2.8) 


où l’on a posé u, = pi (n) et introduit encore w, = 1 et vw, = (0. 
C'est une conséquence de la formule générale de la probabilité 
totale. Notamment, si l’on introduit les événements B, « le syste- 
me après À pas retourne pour la première fois dans l’état initial ë », 
k = 1,..., n, et B,,, « le système dans les premiers x pas ne se 
retrouve pas une seule fois dans l’état à », alors B,, ..., B,+, sera 
un système complet d'événements et la probabilité de l'événement 
A « le système après r pas reviendra à l’état initial ë » est donnée 
par la formule de la probabilité totale, soit : 

n+i 

P (4)= à P (41 Bx) P (Bu), 
1—= 


* 


ou 
P (Bx)= 04 ; P (A]Bx)=un-», k=1,..., n ; P (4] Ba+) = 0. 


Nous allons utiliser les fonctions génératrices : 


U (2) = D uyz*, V (z) = Ÿ Unz", | z [<1. 
k=0 k=0 


Il est évident que ce sont des fonctions analytiques pour | z | << 1. 
La relation (3.2.8) valable pour tous les rz = 1, 2, ..., peut s’écrire 
comme suit : 


U(z) —u = U(:) V (z), w = 1, 


d'où 
1 
U (z) —= 1=VG . (3.2.9) 
La récurrence de l’état à signifie que 
v= D vs lim V(z)—1. 
k—0 z—1 


L'égalité (3.2.9) montre que la relation limite est équivalente à 


. - 1 
limU(z)=lim- = 00. 
21 G) 21 1—V() 
Mais 
oo O 
lim U(z)= lim D unz"= Ÿ un, 
Zi z-i n=0 n=0 


ainsi, le retour en l'état i équivaut à la convergence de la série 


Sun. Pour terminer la démonstration, il suffit de rappeler que u, = 
n=0 


= Dis (n). 
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Théorème 2. Si l’état initial i est récurrent, le système avec la pro- 
babilité 1 après un nombre infini de pas retournera en i un nombre in- 
fini de fois. Si cet état est non récurrent, le système avec la probabilité 
1 prendra après un nombre infini de pas l’état i seulement un nombre 
fini de fois, en d'autres termes, après un certain nombre fini de pas il ne 
relournera jamais en ji. 


Démonstration. Désignons par v, le nombre de pas pré- 
cédant le premir retour en ë, par v, le nombre de pas précédant le 
second retour et ainsi de suite. Si durant un nombre infini de pas il 
se produit moins de k retours, on pose v, = co. L'événement {v, < 
<o } signifie qu’il s’est produit moins de k retours. La probabilité 
de retour est P {v, < oo} = v. Si l'événement {v, < œ} s'est 
réalisé, le système après un certain nombre fini de pas v, retourne 
dans l’état initial ë, après quoi son comportement ultérieur suivra 
les mêmes lois tout comme s’il venait de commencer son mouvement. 
Ainsi, la probabilité de l’événement {v, << oo} à condition que 
{v, << ©} sera de même égale à v: 


P {vs << oo [v, < oo} = v. 
Il est évident que si v, = co, alors v. = o. On en déduit que 
P {ve < oo} = P {v, < 00 | v, << oo}. P {v, < oo} = 1. 
D'une manière tout à fait analogue, quel que soit 4, on a 
P {va < oo | vyn <'o)=v, P {v; < œ} = v}. 


La non-récurrence de l’état à signifie que v << 1. Dans ce cas, 
D P{m<o}= Ywt< oo, 


et en vertu du lemme de Borel-Cantelli (voir page 59), seul un nom- 
bre fini d'événements du type {v, << oo} peut se réaliser avec la 
probabilité 1, c’est-à-dire qu'avec la probabilité 1 le système pour 
un nombre infini de pas se trouvera en à seulement un nombre fini 
de fois. 

La récurrence de l’état à signifie que v — 1. Dans ce cas, quel 
que soit £, on a 

Pp {ve hd ©0 } = 4. 


Désignons par x le nombre de retours pour un nombre infini de pas. 

Il est évident que les événements {x > k} et {vy << ©} sont iden- 

tiques et que {x = oo} = NN] {v, << æ}. En vertu de la continuité 
k 


de la probabilité, on a 
P {x = co}—lim P {v, << oo}=—1. 
k— 00 


Le théorème est démontré. 
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Exemple (mouvement errant). Considérons le mouvement 
aléatoire d’une particule susceptible d'occuper les points entiers de la 
droite réelle. La particule se déplacera de 1 avec la probabilité 
p dans le sens positif, et avec la probabilité g — (1 — p) dans le sens 
négatif. A partir de la formule (3.1.1) on a 


2 4pql" 
(nr)! Lpal" — T4pg]" 


ninl in 


pii (2n) — 


Quand le mouvement est symétrique, donc p = qg = !/,, pu (2n) — 
= 1/V an et la série D LT (2n) est divergente, tous les états sont 


récurrents. Si p ÆQ, lorsque 4 pq <1 et 2Pu (2n) << 00, tous les 


états sont non récurrents. 

Nous allons définir cette probabilité de retour. Soit au point 0 
un écran dit absorbant : lorsque la particule tombe au point 0, 
elle y reste pour toujours. Il est évident qu’à partir d’un état quel- 
conque à >> 0 elle peut avec une probabilité positive passer dans 
tout état j >> 0. Désignons par v;; la probabilité de passer de à en j. 
On a ainsi la relation 


Vi = Plitt,j + it 


déduite de la formule de la probabilité totale. Cette relation est une 
équation aux différences finies pour v,; en tant que fonction de 
= 1, 2, .... Pour trouver la solution v,; de cette équation, on 
a encore besoin de « conditions aux limites » supplémentaires. Cel- 
les-ci peuvent être trouvées à partir du raisonnement suivant. Les 
probabilités v;,, i -j, restent invariables si l'on place un écran 
absorbant également au point j. Dans ce cas on a évidemment 
Vo; = 0 et v;; = 1. La fonction v,, de i = 1, 2, ..., j — 1, satis- 
faisant à ces « conditions aux limites » s’écrira pour p q: 


vi, = Aj+B; (2), O<i<}j, 


où 
1 


g\i” 
(5) 
par contre si p=gq=1/,,0on a 
Vtj = — ’ 0 Ti< je 
Il est clair qu’on a des formules analogues également dans le cas où 
l'écran absorbant se trouve en un certain point k, k4 << i < j (dans 
les seconds membres des formules mentionnées il suffit de remplacer à 


par i — k et j par j — k). Sik — —0oo, l'influence de l'écran absor- 
bant disparaît et les formules limites donnent l’expression des proba- 


A;= B,=— 1 _. 


142 MODBLES DE PROCESSUS ALÉATOIRES [CH. IL 


bilités v,; de transition du point à au point j > à pour le cas d’un mou- 
vement errant ordinaire sans écran absorbant. Ces formules pren- 
nent la forme: 


(2) pour pc 
Uij =. | (E< j}e 
| 1 pour P>-. 


En remplaçant p par g on obtient les expressions des probabilités 
Vij, pour > j, à savoir: 


| (2) pour p>2, Ce 
Vij = R (Zj). 
1 pour ES ER 


Toutes ces formules ont été obtenues en supposant un écran absor- 
bant placé au point j et il est naturel qu’elles donnent pour i = j la 
valeur v;; = 1. La probabilité réelle v de retour dans l’état initial 
i — j peut être calculée d’après les probabilités a;;, trouvées précé- 
demment pour i j, comme suit: 


U = Pis à + QUit. is 


ce qui donne pour la probabilité de retour l'expression suivante: 


2p pour p< | 


U—)2q pour 1>+ =œ1—|p—3g|. 


\1 pour p=qgq 


3. Temps moyen de séjour dans un état. Classification des états. 
Nous allons considérer une chaîne de Markov générale E (n). n = 
= 0, 1, .... Supposons qu’à l'instant initial le système se trouve 
dans l’état E (0) = i. Désignons par v le nombre de pas précédant le 
premier retour dans cet état (si l’on suppose chaque pas prenant une 
unité de temps, v est le temps de retour en i). Pour un état récurrent 
le temps de retour est fini avec la probabilité 1:P {v < co} = 1; 
pour un état non récurrent on a par contre 


P{v<oo}j=v<1, P{v=oo}=1—v>0.  (3.2.10) 


Introduisons la valeur moyenne 
u=Mv= À nP{v=n}, (3.2.11) 
n=1Î 


en posant naturellement u = o pour l’état ë non récurrent. 
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Considérons tout d’abord le cas où u << ©. En vertu du théore- 
me 2, le système retournera continuellement avec l'écoulement du 
temps dans l’état initial ë. Désignons par v, (—) l'instant du premier, 
v, celui du second, . . ., v, celui du n-ième retour dans l’état i. Com- 
me nous l’avons déjà noté dans la démonstration du théorème 2, le 
comportement du système après le retour à un quelconque des ins- 
tants v, dans l’état à (pour E (v;) = i) ne dépend pas de son com- 
portement précédant l'instant v, et suit les mêmes lois qu’au début, 
c'est-à-dire à l’état initial E (0)—ài. En particulier, les variables 
T1 = V1, temps du premier retour, T: = (v: — v,), temps du second 
retour, ..., Tn —= (Va — V1), temps du n#-ième retour dans l'état 
initial ë, seront des variables aléatoires indépendantes de même 
distribution et de valeur moyenne u. En vertu de la loi forte des 
grands nombres (voir (1.5.7)), on a 


25 TU pour ñr—+> 00 (3.2.12) 
k—1 


avec la probabilité 1. 


nm 
Dans cette relation v, = > +, est le temps durant lequel se sont 


k=1 
réalisés exactement x retours dans l’état à (rappelons que, par hy- 
pothèse, chaque pas prend une unité de temps), en d’autres termes 7 
est la durée totale de séjour du système à l’état i dans l’intervalle de 
temps compris entre 4 et v,. Désignons par rx la durée totale de 
séjour du système à l’état à dans un intervalle quelconque compris 
entre À et NV (nr = nr; est le nombre de retours du système à l’état à 
dans un intervalle de temps compris entre 1 et VW). Comme n — 
= Ax —+ 00 pour V — œ (voir théorème 2), de la relation limite 
(3.2.12) il vient que 


V 
1, Lu pour N oc 


Va 
— —+ LL, a 


Lo 
n n +1 
avec la probabilité 1. Il est évident qu’en vertu de la définition du 
nombre 7, on a Van SN < Van €t, par conséquent, 


Nu pour À —+ co (3.2.13) 


nN 


avec la probabilité 1. 

Nous allons montrer maintenant que la relation limite (3.2.13) 
est également vraie dans le cas où la valeur moyenne u définie par 
l'égalité (3.2.11) est infinie (Uu = + co). Pour un état à non récurrent 
ceci découle immédiatement de la seconde partie du théorème 2 
(nr, reste bornée pour V —+ o avec la probabilité 1). Pour un état à 
récurrent nous allons nous référer de nouveau aux variables indé- 
pendantes t, = Vy — Vp_1, k = 4, 2, ... . Définissons les variables 
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« tronquées » tT£ (T* < T:) en posant : 
={ T4 POUr TR LM, 
O0 pour > m. 


3 


La valeur moyenne 


DM = À nP (= n) 
de ces variables (voir (3.2.11)) pour m suffisamment grand peut être 


rendue aussi grande que l’on veut, car D nP (t, = nr) = co. En vertu 
n= 1 


no 7 


de la loi forte des grands nombres, lim — D, = u" avec la probabi- 
k=1 


lité 1, c'est pourquoi 
ñn 


lim lim LS Tr > lim 2 TX = 


lim 
Ainsi, la limite inférieure — 


‘5 T, surpasse le nombre u”* aussi 
er 
grand que l'on veut, c’est-à-dire: 

n 


LS Tz —> OO pour 7—> 00 (3.2.14) 
hk=1 


avec la probabilité 1. Tout comme à partir de (3.2.12), de (3.2.14) 
on déduit (3.2.13) pour u = oo. 

Le rapport rN/N des variables #3 et N figurant dans la relation 
limite (3.2.13) est une partie du temps de séjour du système à l’état 
i dans l'intervalle de temps compris entre 1 et WV et (3.2.13) équivaut 
à l’assertion suivante. 


Théorème 3. Avec la probabilité 14 on a 


Re pour N + oo, (3.2.15) 


où u est le temps moyen de retour dans l'état i. 

On voit aisément que ce résultat reste vrai pour tout état à (non 
nécessairement initial), il suffit seulement que le système tombe 
tôt ou tard dans cet état (après quoi son comportement suit les 
mêmes lois comme si c'était à l’état initial à). 

De la relation (3.2.15) il résulte (voir théorème 5, $ 4, chapitre Î) 
que Â/u coïncide avec la limite lim M EE | des espérances mathé- 


No 
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matiques des variables aléatoires bornées n,./N. Pour trouver l’ex- 
pression explicite de l'espérance mathématique Mn, du nombre de 
retours à l’état à dans l'intervalle de temps V. introduisons les 
variables 

4 1 pour E(k)—i, 

#71 O0 dans tous les autres cas. 
Il est évident que 


N N N 
nv 4, Mas = NN Mu= Ù path). (3.2.16) 
k—1 k--1 h—1 
Finalement on obtient 
N 
.. À A À 
lim w À pi (H)=—. (3.2.17) 


On dit que l’état iest positif si 1 > 0 et nul si " = 0 (rappelons 


qu’en vertu de (3.2.15) la variable 1/u est une partie du temps de 
séjour du système dans l’état i pendant un intervalle de temps infini). 

On dit que l’état j est accessible à partir de à si le système dans 
un certain nombre de pas peut avec une probabilité positive passer 
de i en j, c'est-à-dire p;; (M) > 0 pour un certain M. Si j est réalisable 
à partir de à et à l’est à son tour à partir de j, on dit que ces états 
ë, j sont communicants. 

Soit à un état récurrent et soit j accessible à partir de i. Alors à 
est à son tour accessible à partir de j, car dans le cas contraire à la 
sortie de à le système après M pas tombe avec une probabilité posi- 
tive Pi (M) = & > 0 dans l’état j sans pouvoir jamais retourner 
en i ; ainsi, la probabilité de retour en à ne sera pas supérieure à 1—«, 
ce qui est en contradiction avec la supposition que àë est récurrent. 
Donc, si j est accessible à partir d’un état récurrent i. ce dernier est 
à son tour accessible de j, c'est-à-dire que py; (N) = B > 0 pour un 
certain {V, alors les états i, j sont communicants. 

Pour des états communicants ë, j quelconques (tels que p;,; (M) = 
= &«>0, py; (N) = B > 0, pour M et N quelconques) la relation 


PM+K+N)=P(M)P (K)P(N)=P(N)P (KP (M) 
(où P (n) = {pyi(n)} est la matrice des probabilités de transition 
Pr: (n) > O0 — voir (3.2.2) et la suite) permet de trouver que 


Pi (KE +M+EN)2> pi (M) p;; (K) pj (N) = afp;; (K), 
Pi (K+M+N)>pa(N) pa (K) pi (M) = a pi (K). 
Ces inégalités montrent d’une part que les séries 


Dpu(k), 2P;5(k) 
k R 


10-0521 
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sont simultanément convergentes ou divergentes, d'autre part, que 
les deux limites 


N N 
. 1 . | 
im y DPu(), lim» pat) 
k=1 k=1 


sont soit nulles, soit positives. Compte tenu du théorème 2, on en 
conclut que les états accessibles à partir d'un certain état de récurrence 
sont également récurrents. Il est évident (voir (3.2.7) et (3.2.17)) que 
les états communicants sont de même type: récurrents ou non 
récurrents, positifs ou nuls. 


Soit à un état récurrent. Comme nous l’avons déjà montré, tous 
les états j accessibles à partir de i sont récurrents et communiquent 
avec i. Tous les états j mentionnés forment une classe dite classe 
fermée d'états (nous la désignerons par Æ) telle que si le système 
à un pas quelconque tombe dans l’un des états j € £, il soit inclus 
pour toujours dans l’ensemble des états Æ (tout état réalisable à par- 
tir d’un état j € Æ quelconque fait également partie de Æ) ; de plus, 
pour j € E quelconque la classe Æ peut être définie comme l’ensemble 
de tous les états réalisables à partir de j. 

Considérons deux classes fermées quelconques d’états récurrents 
que nous désignerons £, et Æ,. Supposons qu’un certain état j fasse 
simultanément partie de £, et Æ,. Dans ce cas les classes £, et E, 
coïincident, car chacune d'elles s’identifie avec l’ensemble de tous les 
états réalisables à partir de j. Par conséquent, les classes £, et £, 
soit coincident, soit sont disjointes (elles n’ont pas d’états j communs). 

Prenons l’ensemble £, de tous les états non récurrents et divisons 
les états récurrents restants en classes fermées Æ,, E°,, ... disjointes 
(chacune représentant un ensemble d'états récurrents]Imutuellement 
communicables). 

Comme le montre l'exemple du mouvement errant étudié à la 
page 141, le système peut en général tendre avec le temps vers 
l'infini suivant une certaine chaîne d'états non récurrents dans £Æ, 
(si le nombre de ces états est infini). Cette éventualité est exclue si le 
nombre d’états non récurrents est fini. Dans ce cas le système re- 
prendra chacun des états non récurrents avec la probabilité 1 seule- 
ment un nombre fini de fois et se retrouvera tôt ou tard dans un 
état récurrent i quelconque; ensuite il « circulera » dans une classe 
fermée E d’états récurrents contenant à (en particulier, il en est ainsi 
dans une chaîne à un nombre fini d'états). 


4. Théorème ergodique (tendance vers une distribution station- 
naire). La distribution p?, à = 1, 2, ..., pour une chaîne de Markov 
de probabilités de transition p:; est dite stationnaire si la condition 


p = 2 PiPin J=1,2,..., (3.2.18) 
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se trouve vérifiée. Les relations de récurrence générales (3.2.1) mon- 
trent que la condition (3.2.18) signifie que pour la distribution 
pi (ro) = PT, à =1, 2, . les probabilités psfn)*d'avoir le système 
dans le n-ième pas dans l’état j =1,2,..., restent: invariables pour 
tous les n > no: 


Pin) =pi, j=1,2,.... (3.2.19) 


Supposons que les états de la chaîne de Markov envisagée formant 
une classe fermée soient positifs et que pour z quelconque on ait de 
plus le coefficient d'ergodicité k (n,) positif défini par la formule 


k (no) = 1 + sup D | Pim (N0) — Pim (70) |. 


Notons que le coefficient d’ergodicité Æ (n,) admet l'estimation 
simple suivante: 


k (ne) >sup inf Pay (na), (3.2.20) 


d'où k (nr) > 0 s'il y a au moins un état j réalisable à partir de tout 
état i (pour un même nombre de pas 7,) avec la probabilité p;; (no), 
Puy (ro) > 8 > 0 pour tous les à = 1, 2,... 

Notons également que la condition k (ne) > 0 n’est pas toujours 
vérifiée. A titre d'exemple trivial, on peut citer une chaîne de 
Markov à deux états 1 et 2 lorsque le système change périodiquement. 
(à chaque pas) d’état (dans ce cas p,, (n) = 1, pes (n) = 0, px (n) = 
= 0, pee (n) = 1 pour r pair, pu (n) = 0, pa (n) = À, pu (n) = 1, 
Peso (n) = 0 pour nr impair et 2 | Pin (7) — par (n) | =2 pour tous 


les n). 


Théorème 4. Si pour un certain n, on a k (no) >> 0, les limites 
lim ps(m)=p}, j=1,2,...s (3.2.21) 


existent, de plus les probabilités pf, j = 1, 2, ..., jorment une distri- 
bution stationnaire. Pour toute distribution initiale pr i = 1,2, 

les probabilités limites p?, j = 1, 2, , sont les mêmes et L'esti- 
mation de la vitesse de convergence dans la relation limite (3.2.21} 
est la suivante: 


sup|p;(n)— pi |<Ce-Dr (3.2.22} 
Pi 
1 1 { 
(c- KG" Do M TER) )- 


Démonstration. Posons 
r'J (r)= inf Pin), RÀ; (#) = sup Pis (n). 
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On a 
ri(n+1)=infpi;(n +1)= inf È Pix Pas (r) > inf à pixrj(n)= r;(n), 
R;(n+1)=sup pis(n+1)= 

= sup à : Pin Pas (n) <SUP 2 Z piuR;(n) = R;(n). 


On obtient ainsi la chaîne suivante d’ mégalités : : 
r1)&ri (2)... Lrifn) <... SRE... LR;(2)<Rj(). 
Quels que soient les états & et f, on a 


2 Par (0) — 2 Per (no) — 2 [Pan (no) — Pen (n0)] -- 

+ > [Pan (0) — Ps (n0)] = 0, 
où 2 désigne la sommation sur tous les kÆ tels que la différence 
Par (70) — Ppn (0) Soit positive, et 7 la sommation sur les k tels 
que la différence Par (70) — Pr (no) soit négative. Il est évident que 

sup 23° [Pau (0) — pau (m0)1 = 1 — (no), 


où k (nr) est le coefficient d'ergodicité. En utilisant les relations 
obtenues, donnons une estimation de la différence R; (N) — r;, (N). 
On a 


R; (no) —r; (no) = SUP Paj (20) — inf P83 (Ro) — 
= sup [Paj (0) — Ps: (r0)] <SUP > [Pan (0) — Pix (n0)] = [1 —%(no)] 


et 
R;(no+n)—r;(ro +7) = Sup Pa; (ro + n) — pe;(ro — n)] = 


— sup > [Pak (rs) — Ppx (n0)] Pa; (n) < 

<sup 2 [Pau (20) — Psx (n0)] Rj(n) + 

+ 2 [Pak (Ro) — Peu (Ro)] r;(n)| = 

= sup (22° [Pa (0) — pra (mo)] LR; (re) —r; (n)]] = 
={[1—%&(no)][R;(n)—r;(n)]. 


On en déduit que 
R; (Nno) — r; (Nno) LU — FA (n)IN, N =1,2,.... 
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La suite r;(n), nr = 1, 2, ..., est à croissance monotone et la suite 
R;(n), n = 1, 2, ..., à décroissance monotone, de plus, r;{(n) < 
< R;(n). L’ estimation obtenue ci-dessus pour la différence R 3 (n) — 

— r;(n) montre que ces suites ont même limite pf: 


pi=limr, ()= lim R;(n). 


N— 00 IN = 00 
On a de toute évidence 
Las (0) — pi | SR (n)—r; (n) SA —E (0) 5e 7. 
Pour une distribution initiale quelconque pi, j = 1, 2,...,on a 


[= T2 


|p;(r) — p* pioiuy(n)—pi|< < 2 pilpis(n)—pF|< 


n 


D PRG) 7 1 Rs (n)—r (EC — Km)" 


Les estimations obtenues peuvent de toute évidence s’écrire sous 
la forme (3.2.22) pour les constantes C et D correspondantes, en 
posant 


1 D = — I]n 1 


C= (no) ? no 1—k (no) 


Nous allons montrer que les probabilités limites p? satisfont au 
système d'équations (3.2.18). A cet effet, notons que la somme à p} 
J 


est finie car, quel que soit m, on a 


Ÿ p*= lim Y > Pin)<1. 


j<m no jm 
Par suite, à partir de l'inégalité p; (n + 1) >> pa (n) pi; (voir (3.2.1)) 
iSm 


on déduit que >> PiPiy pour tout m fini et, par conséquent, 
iTm 
Vpn. ji—1. 2 3.2.93 
P;j 7 2 PiPiis J—= le ése.. (3.2.23) 
La sommation de toutes ces inégalités donne: 
à 
D rr>> (D prtriu=S pt(S puy) = À 
J J L À 1 
On remarque qu’on a ici une égalité rigoureuse (> pi = Ÿ pi), par 


J 1 
conséquent, on doit avoir une égalité rigoureuse dans toutes les 
relations (3.2.23), ce qu’il fallait établir. 
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Démontrons également que toutes les probabilités p* sont posi- 
tives et que » pi = 1 Il est évident que 
2 


ñn 
pj= lim pij(r)=lim _ 21 pus(n), 
ñn—+00 ñn—+00 k—1 


et, par conséquent, les probabilités finales p* pour les états positifs 
sont telles que 


p=>0, j=12,..., (3.2.24) 


où u, est le temps moyen de retour dans l'état j (voir (3.2.17)). 
Puis, si pour répartition initiale on prend . 


(1 $ 1 . 
 — , i= 1, 2, 7 
P; P DS 


3 


alors les probabilités p° qui ne diffèrent de p? (i = 1, 2,.:. .) que par 
le facteur (> pi) ! constant satisfont au système homogène d’équa- 


tions (3.2.8) : 
= 2 PiPign Ï—=1, 2 .... 


Pour une distribution stationnaire p?, i =1,2,...,ona 
pi(n)=p$ et pf=lim p;(n)=p}, j=1,2,..., 
n—…+00 


on en déduit que >, p* =1. Ainsi, les probabilités limites p?, i — 


J 
— 4, 2,..., forment une distribution stationnaire (qui est de toute 
évidence unique). 

Notons que les probabilités limites p}, en tant que probabilités 
stationnaires, peuvent être définies à partir du système d'équations 
linéaires (3.2.18). 

Le théorème se trouve ainsi démontré. 


Exemple (pile de livres). Sur un bureau on a une pile de m 
livres. Si l’on numérote chacun des livres dans l’ordre de leur dispo- 
sition de haut en bas, on arrive à décrire cet ordre par une combinai- 
son de m nombres (ë,, de, + - «+» êm), OÙ à, est le numéro d'ordre du pre- 
mier livre d’en haut, à, — celui du livre suivant, .…, à, — celui du 
dernier livre se trouvant tout en bas. Supposons que l’on tire chaque 
livre avec une certaine probabilité, c’est-à-dire que l’on prend le 
livre kÆ avec la probabilité p4 (k— 1, . . ., m) et qu’on le remet par 
la suite sur le dessus de la pile. 

Soit un état arbitraire (i,, ês, . . ., im). Au tirage suivant cet état 
soit reste inchangé avec la probabilité p:,, lorsque c’est le livre à, 
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de dessus qui est choisi, soit il passe en un des m — 1 états du type 
(is 1 - -.), ce qui se produit avec la probabilité pi, au choix du 
livre lp Æ be 

On a ainsi une chaîne de Markov dont chacun des états se décrit 
par la permutation correspondante (ë,, a, . . ., im) et par les probabili- 
tés de transition indiquées. Si un certain livre à n’est jamais pris 
(p; = 0), tous les états (i,, . . ., im), où à, = à (le livre à est sur le 
dessus de la pile), sont non récurrents, car déjà au premier tirage on 
choisit un certain livre j, j = i, et la suite de l’expérience approchera 
le i-ième livre, qui n’est jamais pris, du bas de la pile. Si chaque 
livre est choisi avec une probabilité positive p; > 0. chaque état est 
réalisable à partir de tout autre état (on a en tout m! états— permuta- 
tions différentes (ë,y, . . ., êm)), et tous ces états communicants sont 
positifs et forment une classe fermée. De chaque état (ë,, . . ., ) on 
peut passer en effectuant m tirages à un état quelconque (j,, . .., jm) 
avec une probabilité supérieure au produit p, ...pAn (ce produit 
est égal à la probabilité de transition de (ü,, . . ., im) en (j,, . . ., jm); 
lorsque l’on prend au premier tirage le livre j,,, au second le livre 
Îm-1 etC., au dernier m-ième tirage le livre j,). Par conséquent, le 
coefficient d'’ergodicité Æ(m) est positif (Æ(m) > Pi, Pas - + «+» Pm 
(voir (3.2.20)), et la distribution devient avec le temps stationnaire. 

Considérons tout d’abord le cas m = 2. On a seulement deux 
états (1, 2) et (2, 1). Les probabilités de transition sont de 
la forme : 


Pin = Per = Pis Pas = Pos — Po 
et la matrice des probabilités de transition est: 
pe (” ”] | 
Pa Pas 


Les probabilités de transition dans deux pas sont: 


Pau (2) = Pai (2) = PaPa + PaPs = P1 (a + Pe) = Pure 
Pis (2) = Ps (2) = P1Pe + PePa = Pe (1 + Pe) = Pe- 
On voit que P° — P et en général P" = P. Quelle que soit la dis- 
tribution initiale, on a 
Pa (r) = Pi Pau () + PiPa (r) = Pi GS + Pa) = Pr 
Pa (n) = PiPis (n) + PiPes (n) = Pe (Pi + P9) = Pe. 
On voit s'établir une distribution stationnaire dès le premier pas. 


Considérons le cas de m quelconque. Désignons par 
Pi i), G . . la probabilité de transition de l’état 
ae cs im Ogre 2m) 


(is «+ +. im) dans l’état (j1, - « ., jm). Comme nous l'avons déjà 
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montré 

Pi, pour (ji, ..., jm) = (in, -..), 

O pour les autres (j1, ..., jm), 

où la permutation (ë,, . . .) s'obtient à partir de (ë,,..., i,) par le 


choix d’un certain ë,, que l’on place premier. Les probabilités station- 
naires P(; j_) Sont solution du système d'équations linéaires 
be im 


suivant (voir (3.2.18)): 


Puis... , im), Ga. Lim = À 


m 
#. np SN p* 
PGi +... im) = Di: = Pie, .…, in ur Sgen ee)" 


Il est naturel de connaître la probabilité avec laquelle chacun des 
livres se trouvera sur le dessus de la pile, lorsque, après un nombre 
suffisamment grand de tirages, on a pratiquement une distribution 
stationnaire (c’est-à-dire lorsque la pile de livres prendra avec des 
probabilités constantes Pti. sin) les positions correspondantes 
(is + - + Em)). 

La probabilité d’avoir le livre i sur k dessus de la pile est de 
toute évidence égale à 

+ V * 


P; TT, e— (io i9, ee, im )9 
19, 


où la somme est prise sur tous les états dans lesquels i se place pre- 
mier. Les équations pour les probabilités stationnaires donnent : 


2, ..., age io ige ces im) 


Le  N a …: 
pi, =. Pis... im) — Pis i=1,...,m, 
im 


c'est-à-dire que la probabilité p? d’avoir le livre i sur le dessus de 
la pile est égale à la probabilité p, avec laquelle le livre a été choisi. 
Ainsi, plus souvent est pris un livre, plus grande est la probabilité 
de l'avoir sur le dessus de la pile. 


Exemple (mouvement errant). Considérons le mouvement 
errant d'une particule qui passe avec la probabilité p; du point à 
au point j = à + ÂÀ voisin et avec la probabilité g: = 1 — p; au 
point j = 0. Nous allons supposer que 0 << p; << 1. Il est évident 
que tous les états sont communicants et simultanément récurrents 
ou non récurrents, nuls ou positifs. 

Supposons que la particule se trouve à l’état initial ë = 0. La 
probabilité de ne retourner aucune fois dans l’état initial ë — O0 dans 
les z pas suivants est égale au produit PoPi + + - Pn-1 qui est la proba- 
bilité pour que le système parcourt successivement la chaïne d'états 
0O0—1—+...—n. Il est facile de voir que la probabilité de ne revenir 
aucune fois dans l’état initial : — 0 en un nombre infini de pas est 
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égale au produit infini: 

Lee 

IL Pr — Jim PoPi - - - Pn:- 


Si ce produit infini converge vers zéro, c'est-à-dire si lim PoPi + + : Pn = 


—= 0, l’état à — 0 est récurrent. Dans le cas contraire, “la probabilité 
de retour est 
Uu—1Î1—]|lim popi - -. Pan L1, 
n— 00 
et l’état i —.0 est non récurrent. 

On peut arriver à ce même résultat d’une autre manière en con- 
sidérant directement les probabilités v, du premier retour dans l’état 
initial O0 après exactement r pas. Il est évident que le premier retour 
de la particule dans l’état O0 au n-ième pas se réalise si aux premiers 
n — 1 pas elle passe successivement de l’état à — 1 à l’état à (avec 
les probabilités p;_,, à = 1, ..., n — 1) et, par conséquent, 


Vi = 1 — Po, Un — Po --- Pn-2 (1 — Pn-1), n = 2, 3, ... + 
La probabilité de retour dans l’état initial O est par définition égale 


à la somme Ÿ Un, Soit : 
n=1 


= 2 Un = 1— Po+[Po(1—ps)] +... =1—1lim poPi -.. Pn. 
n—=— n— œ 
Pour des états non récurrents, lorsque v << 1, la particule avec 
la probabilité À pour 7 — œ prendra la direction de -— ©, pour 
des états récurrents, elle retournera dans chacun des états un nombre 
illimité de fois. Le temps moyen de séjour à l’état initial à = 0 est: 


u=— Ù nva=(1— po) + 2(1— ps) Po + 3 (1 — P2) PoPi + - 


n- ! 
. +R (1— Pn-1) Po - + Pn-2 + +. == 1 + Po + PoPi + ... 
+ PoPi -- Pan t..., 
et à condition que 
p=l+ À po... Pni< 00 
tous les états sont positifs. 

". Dans le cas le plus simple où les probabilités 1—p; de transition 
de tous les états à à l’état initial O0 sont telles que 1 — p; > Ô > 0, 
à = 0, 1,..., pour le coefficient d'ergodicité il est facile de donner 
l'estimation suivante: 


k(1)>inf(1— pi) >ô 
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(voir (3.2.20)), ainsi que celle de la vitesse de convergence vers les 
probabilités limites p*f, j = 0, 1, ..., (voir 3.2.22)) formant une 
distribution stationnaire. Cette distribution satisfait au système 
d'équations (3.2.18) qui dans notre cas s'écrit comme suit : 


Ps — Pj—1 Pj-1, j = 1, 2, ...) 
d’où 
Pi = PSPo: PS = PS PoPi, 1 Pn = PS Po eee Pn=i: ee. + 
Comme 


+ 


1 = 2 Pn = PS [1 +2 Po - -: Pn-1] = Dil 
on a finalement 


_ À #__ Po + __ PO --: Pn=1 3.2.95 
ne Pi RE nn y. + (3.2.25) 


+ 


Po 


$ 3. Chaînes de Markov (temps continu) 


1. Equations différentielles pour les probabilités de transition. 
Considérons un processus de Markov homogène E (£) à un nombre fini 
ou dénombrable d'états 1, 2,...,ne différant des chaînes de Markov 
considérées dans le paragraphe précédent que par la variation conti- 
nue du paramètre £{ (temps), ainsi que par la transition d'un état 
à l’autre réalisable à tout instant #4. Tout comme précédemment 
nous parlerons de façon conventionnelle d'un système physique dont 
l’état de phase à l’ instant £ est & (4). 

Désignons par p;; (t) la probabilité de transition de l’état à à l’é- 
tat j durant le temps t; précisons que p;; (t) est par définition la 
probabilité de prendre l'état j après le temps #, à condition que 
l'état initial soit à: 


Put = P{E(+S) =jIE(S =i}, à, j —=1, 2, ... 


Soit pi, à = 1, 2,..., la distribution initiale. D'une manière ana- 
logue à (3.2.1), les probabilités p, (t) de prendre après le temps é l’é- 
tat correspondant j = 1, 2, ... sont données par les formules sui- 
vantes : 


PO) =2 pipuj(t), j—=1, 2, ..., 
pus(t+s)= 2 pur () puits), à, j=1, 2,..., (3.3.1) 


pour tous les £ et s, où 
pu ©) = 


1 pour i=}j, 


0 pour i£j. (33.2) 
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Nous allons supposer que pour tous les ë, j = 1, 2, ... les probabi- 
lités de transition p;; (t) satisfont aux conditions suivantes *) (com- 
parer avec (3.2.5) et les suivantes): 


À — pu (At) = Ait + 0 (At), 
puy (At)=hjNt+o(At), j#i, (3.3.3) 
où 202 —+0 pour At —+ 0, A4 est la densité de sortie de l'état ë, À,, 


les densités de transition de i dans l’état j correspondant. Posons 
Au=—ÀAyi-=1,2,... e 


Théorème 1. Pour un processus de Markov à un nombre fini d'états 
sous la condition (3.3.3) les probabilités de transition pi; (t) satisfont 
aux équations différentielles 


Pi; (4) = 2 un pas (0), i, j—1, 2, ..., | (3.3.4) 
el 
pis (9) = 2 pu an à = 1, 2... (3.3.5) 
pour les conditions initiales (3.3.2): 
Les équations (3.3.5) forment le système direct, et les équations 


(3.3.4) le système inverse d'équations différentielles de Kolmogorov. 


Démonstration. En vertu de la formule générale (3.3.1), 
pas (£+ At) = À pan (At) pns (#) = 25 pin (8) Pas (D). 


En utilisant les expressions asymptotiques (3.3.3) on obtient que 


Pi] CE — pu (8) =2 [ Aux + 0 9 | Pkj (é) = — > Pth (£) [As + o (At) è 


Les seconds membres de ces égalités ont une limite bien définie 
pour At —+> 0: 


lim 2 E a+ 2e ) ] Pay (t) = 2 AinPas (€), 


Mir 2 Pin () LT + md] = = © pan (t) Ans. 
k 


*) Notons que la relation (3.3.3) sera vérifiée si (comme dans la démons- 
tration des formules (3.2.6) pour les probabilités x;; de transition en j directe- 
ment à partir de i) on suppose que la probabilité de cette transition dans un 
intervalle de temps petit At est À;;At + o (At) et la probabilité de plus d’une 
transition d'un état à un autre dans le temps At est o (At). 
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Par conséquent, la limite 

Jim PGA pi; 4 

At-0 At P i( ) 

existe également et les égalités (3.3.4) et (3.3.5) doivent être véri- 
fiées. Le théorème est démontré. 


I1 faut noter que les équations différentielles mentionnées pour 
les probabilités de transition p;; (t) sont vérifiées tant au cas d’un 
nombre fini d'états qu’à celui d’un nombre d'états dénombrable, à 
condition d’un certain nombre de limitations supplémentaires. Par 
exemple, le procédé utilisé ci-dessus pour trouver le système direct 
d'équations différentielles reste valable si dans les expressions 
asymptotiques (3.3.3.) les termes résiduels o (At) sont tels que 


o (At) 


nn — 0 pour Ai—+0 


uniformément pour tous les à, les densités de transition pour ÿ 
fixé étant uniformément bornées: 


À;; < A; < CO, L — 1, 2, .. (3.3.6) 


Notons également que le système direct (3.3.5) est vrai pour les 
probabilités p; (£) quelle que soit la distribution initiale; à partir 
de (3.3.1) et (3.3.5) on obtient immédiatement que 


pi(t)= À ps (un j=1, 2, .….. (3.3.7) 
Nous allons considérer quelques exemples. 


Exemple (flux poissonnien de demandes). Soit un certain 
système d'attente recevant des demandes de telle sorte que E (£), 
nombre de demandes dans le temps t, soit un processus markovien 
homogène (avec les états à — 0, 1, . 

De l’état ë on peut passer directement seulement à à l’état suivant 
i+AÂ,i—=0,1, . Supposons que les densités de sortie de cha- 
cun des états à soient les mêmes et égales à À. Il est évident que la 
probabilité p;; (At) coïncide dans notre cas avec la probabilité 
d’avoir le système dans l’état à: durant tout l'intervalle de temps At 
et, en vertu de la formule (3.1.7), on a 


4 — p;; (At) = AA + o (Ab). 


Il est clair que la densité de sortie À coïncide avec celle de transition 
däns l’état suivant, il s'ensuit que dans notre cas sont vérifiées les 
relations (3.3.3), où 


Ai = À, Mit = À, Mi = 0 pour ji, i + 1. 
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Pour les probabilités de transition p;;(t) on a le système d’'équa- 
tions différentielles (3.3.5). Il est évident que p;; (£) = Do. j-1 (t). 
Posons 

Pj(t) = Po; (t), ji = 0,1, 


Les équations différentielles mentionnées pour les fonctions p; (+) 
sont de la forme: 


Pa () = — Apo (t), 
Ph (#) = APn-1 (6) — Apr (0), k = 1,2, .... 
En passant aux nouvelles fonctions f, (4) = exp, (ft) on obtient 
fo (£) = Àfo (#) + ext pe (6) = fo (E) — hekt po (+) =: 0 
fa (8) = fa (6) + ehtp (8) = Mfa (€) + keMpyus (4) — 
— eh p, (t)— fuit), k=1, 2, 


où fo (0) = 1, f, (0) = 0 pour #4 = 1, 2,.... Le système d'équations 
différentielles du type 


lo (4) — 0, x (4) — Mn 1 (#), k — 1, 2,  . 


aux conditions initiales mentionnées, admet de toute évidence la 
solution suivante: 


2 
fo=t, ft)=at. fn = 0, 
En revenant aux fonctions initiales p, (t) — e"M : (£) on obtient que 


- R 
PR (£) = CE ext. k=:0, 1, .. 


c'est-à-dire que le flux de demandes envisagé est poissonnien. 


Exemple {système à temps de service exponentiel). Supposons 
qu'un système d'attente reçoive un flux poissonnien de demandes de 
paramètre À, (les différentes demandes arrivent indépendamment les 
unes des autres et la probabilité d'arrivée d’une demande dans un 
intervalle de temps At petit est À,- At + o (At)). Supposons égale- 
ment que le service de chaque demande prise à part prenne un temps 
aléatoire t réparti suivant une loi exponentielle de paramètre À,, 
c'est-à-dire : 

P {T>t} = e-ht, 


Considérons deux états du système d'attente : O0 — le système est 
disponible, 1 — Île système est occupé. Nous allons supposer que si 
le système est occupé, les demandes arrivant dans cet intervalle 
sont refusées et quittent le système. 

Supposons qu’à un certain instant £, le système soit dans l’état 0. 
En vertu de l'indépendance des arrivées, le comportement ultérieur 
du système est indépendant des circonstances antérieures et, en 
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particulier, dans l'intervalle At il passe avec une probabilité égale 
à Ao°At + 0 (At) à l’état 1. Supposons qu'à l'instant £, le système 
se trouve dans l’état 1. Désignant par 7, l'instant aléatoire 4, de 
transition de { en 0 (instant de la fin de service), en vertu de la pro- 
priété de la loi de répartition exponentielle (voir chapitre II, $ 2, 
point 2) on a pour le temps de service l'égalité suivante : 


P{tT>tInu>A} = eMt-U), 


On voit que la transition dans l’état 0 et le comportement ultérieur 
du système ne dépendent pas de son comportement avant l'instant £.. 
En particulier, dans l’intervalle At suivant £, le système passera dans 
l'état O avec la probabilité À, -At + o (At). Ainsi, l’évolution du 
système est décrite par un processus de Markov à deux états 0, 1 et 
par les densités de transition correspondantes À,, À. 

Considérons les probabilités de transition p;, (t). Dans notre cas 
Poi () =1 — Poo (ét), P10 (€) = 1 — pu, (t) et les équations différen- 
tielles (3.3.5) s’écrivent : 


Poo (t) + (Ào + À) Poo () = À 
Pau @) + Oo + M) Pu () = À: 


Elles ont pour solution! 
_ (4___M — (ot) À 
Poo (+) — (: ko + M | ie: lo+h ? 
= |[14— ho —(Ao+A1)t Ào 
pu (e) = (1 -) « o+A1 FFrr 


Notons en conclusion que le système d'équations différentielles 
(3.3.5) peut avoir une solution différente des probabilités de transi- 
tion P:; (t) d’un processus de Markov de densités de transition À, 
correspondantes si la condition de stabilité selon laquelle durant 
un temps fini on a avec la probabilité 1 un nombre fini de transitions 
ne se trouve pas vérijiée. 


Exemple (processus de reproduction). Soit un processus mar- 
kovien homogène E ({) décrivant le processus de reproduction de 
certaines particules (£ (£) étant le nombre de particules à l’instant f), 
dans lequel à un nombre ài de particules dans l'intervalle de temps 
At suivant et avec la probabilité À; Af + o (At) s’ajoute une nouvel- 
le particule, la probabilité d'apparition de plus d’une particule 
étant égale à o (At). Les densités de probabilité de transition À,; sont 
de la forme: 

À pour j=i<+1, 
Ai = (i=1, 2, ...). 
O0 pour les autres j 
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Il est évident que la condition de stabilité consiste en ce que le 
temps t nécessaire à un nombre infini de ‘transitions 4 —> 2—+ ... 
(de 1 à co) est infini: T = co. En introduisant les variables aléatoi- 
res T;, temps de séjour du système dans l’état à (t, coïncide avec 
le temps d’attente du changement d'état i), on a 


T = Ti + Te + ...—=lim D T4, 
N— 00 1— 1 
où Ty, à = 4, 2, ..., sont des variables aléatoires indépendantes 
réparties suivant une loi exponentielle de paramètre À, correspondant 
(voir (3.1.6)). La condition de stabilité t = oo équivaut à 


e-t=]im S ee 1—0,. 


Ffi— 00 Ein 
Mais pour une grandeur non négative e-* la condition e-T = 0 avec 
la probabilité 1 équivaut évidemment à ce que l'espérance mathé- 
matique Me-*, égale à 


Me-t=limM (| e7%)=lim [[ Me, 
T— 00 =1 n—-00 j—1 


soit nulle (voir théorème 5, $ 4, chapitre I). On a 


7; _ f _t —À,t … he … 4 
Me 'i— IE (Aie "i)dt= TIR =, 

t — _ 1 
Me = I] Gr) (5) 


— 
— à 


ainsi, la condition considérée de stabilité équivaut à 
00 


I (1-5) =0. 


Mais ceci signifie que S =. — 00, Ce qui à son tour équivaut à la 
i=1{ 

condition DA ; = co. Donc, la condition’ de stabilité du processus 

envisagé de reproduction simple?se réduit à 


SL 0 
——— OO 
À;° ° 
it ls, 

Supposons que cette conditionfcesse d’être vérifiée, alors avec 
une probabilité positive dans un certain intervalle fini # il se forme un 
nombre infini de particules (P {t << #} >> 0). Supposons qu’à l’ins- 
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tant initial on ait exactement une particule. Introduisons encore 
un état signifiant que l’on a un nombre infini de particules. Avec une 
probabilité positive égale à p, (t) = P {t <t} le processus passe 
dans cet état durant le temps £, bien que les densités correspondantes 
de transition À; Soient toutes nulles et que l’équation différentielle 
(3.3.5) pour p, ({) soit: 


Pic (t) = 0, Pic (0) = 0; 


la fonction p,. (t) = 0 est la solution de cette équation, alors que la 
probabilité p,. ({) est positive. 


2. Coefficient d’ergodicité et convergence vers une distribution 
stationnaire. Tout comme dans le cas du temps discret on a le résul- 
tat suivant. 

Théorème 2. Si le coefficient d'ergodicité 


Î 
k (to) = 1—- sup >, | pin (to) — pu (to) | 


est positif pour un certain t, >> 0, les probabilités p; (t) pour que le 
système se trouve après le temps t dans l'état correspondant j = À, 
2, .... pour t — ©, prennent les valeurs limites suivantes: 


pi = lim p;(t), j—=—1. 2,.... (3.3.8) 
{> 00 


Les probabilités limites pÿ ne dépendent pas de la distribution initiale 
Pis i = 1,2,..., de plus 


sup|p;(t)— pi|<Ce-Dt (3.3.9) 
pi 
1 1 1 
(Cros 2): 


(La démonstration est analogue à celle du théorème 4 du paragraphe 
précédent.) 


Pour ce qui est de la condition # (4) > 0 de ce théorème pour le 
cas d’un temps continu, on peut ajouter également qu'un état j quel- 
conque n'est réalisable à partir d’un certain état i (c'est-à-dire p;; (to) >> 
> 0 pour un certain t,) que si la probabilité p;; (t) > 0 est positive 
pour t >> 0 quelconque (pour une chaîne à un nombre fini d’états 
communicants on en déduit que toutes les probabilités de transition 
et le coefficient d’ergodicité X (t) > max min p;; (t) sont rigoureuse- 

p 1 


ment positifs pour tous les £ => 0). 

Nous allons démontrer cette assertion pour le cas d’un nombre 
fini d'états. Considérons tout d’abord la probabilité p;, (t) qui en tant 
que fonction de t est supposée continue et p;; (0) = 1, de sorte que 
pour £ suffisamment petit elle est positive. Mais la relation (3.3.1) 
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montre que pour £ et s quelconques on a 

Pi (S + t) > pai (s) Pa (), 
et la probabilité p;; (t)est en fait positive pour tous les {. Considérons 
maintenant l'état j réalisable à partir de à, c’est-à-dire tel que 


Pi(s)>0 pour un certain s. Montrons que cette probabilité p;; (4) 
est positive pour ét > O0 quelconque. On a 


Pas () > pis (u) py(t—u), u<t. 
Comme nous l'avons déjà vu, la probabilité p;; (£ — u) est toujours 


positive et il suffit donc de montrer que p;; (u) > 0 pour un certain 
u  t. Par hypothèse, p;, (s) > 0. Considérons une chaîne de Markov 


à temps discret et de probabilités de transition p;; = Di) (£) , où le 
nombre naturel nr satisfait à la condition mi (m est le nombre 


d'états). Puisque p;; (r =) > 0, l’état j est réalisable à partir de i. 
On voit aisément qu'il est réalisable non seulement en x pas mais 
aussi en un nombre de pas nr, quelconque ne dépassant pas le nombre m 
de tous les états, c'est-à-dire que p;; (ro à) >0,oùnm _ =u< ft. 
Le théorème est démontré. 

Il est utile de noter qu'une unité de temps conditionnelle A 
quelconque une fois choisie, on peut considérer Ë ({) aux instants & — 
= kA comme une chaîne de Markov E (k), k = 0, 1,..., de proba- 
bilités de transition p;; (k) = p;; (KA). Il est évident que les pro- 
babilités limites p}, j = 1, 2, ..., seront les mêmes que pour le 
processus initial E (4). En rapportant les états j = 1, 2,... de ce pro- 
cessus aux états du même type de la chaîne de Markov E (k) corres- 
pondante (chaque état j peut être récurrent ou non récurrent, positif 
ou nul), on déduit à partir de la relation (3.3.8) pour le temps t 


continu (tout comme à partir de la relation (3.2.21) dans le cas de # 
discret) que 


pour une classe fermée d'états positifs les probabilités limites 
(3.3.8) forment une distribution stationnaire unique 
pi= 2 pipi (t), j=1, 2,..., (3.3.10) 


pour tous les t. 

Pour les probabilités stationnaires p; (t) == p*, à partir des équa- 
tions différentielles (3.3.7) on obtient pour p; (t) = O0 le système 
linéaire suivant : 


Ÿ pt = 0, j=1,2,.... (3.3.11) 


Exemple (système d'attente. Formule d'Erlang). Considérons 


un système pouvant simultanément assurer le service de m deman- 
11—0521 
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des. Supposons que l’on ait m canaux et que la demande soit acceptée 
s’il y a au moins un canal libre, dans le cas contraire la demande 
arrivée n’est pas acceptée et quitte le système de service. Supposons 
que le flux de demandes soit poissonnien de paramètres À, et que le 
service des demandes soit indépendant, le temps de service de chaque 
demande (dans chacun des m canaux) étant réparti suivant une loi 
exponentielle de paramètre À. 

Considérons les états 4 = 0, 1, ..., m, où l’état k signifie que k 
canaux exactement sont occupés. La transition du système d'un état 
à l’autre dans le tempstest un processus de Markov dont les densités 
de transition sont: 


à (e pour j =, 
9° | O pour ji, 


Ào pour j—k+1i, 
Ànj = KA pour j—=k—A, 
O pour jÆk—1, k+1. 


En effet, la transition de # en À + 1 se trouve réalisée à l’arrivée 
de la demande suivante, ce qui se produit dans l'intervalle At avec la 
probabilité A, At + o (Ai). La probabilité pour qu'aucun des k ca- 
naux, occupés ne soit disponible dans l'intervalle At est égale à [1 — 
—AAt — o (At)}" (car le service de chaque canal est indépendant des 
autres) et la probabilité d’avoir l’un des canaux disponible, c'est-à- 
dire celle de transition de l’état k en k — 1, est 1 — [1 — A Ar — 
— o (At) = kAAt + o (At). La probabilité d’autres changements 
du système dans l'intervalle At est o (At). 

Comme on peut le voir directement à partir des expressions des 
probabilités de transition p;; (t) obtenues précédemment pour le cas 
m = 1 (voir page 158), pour { + les probabilités p,; (t) tendent 
exponentiellement vite vers leurs valeurs limites. Il en est de même 
au cas de m canaux d'après l'estimation générale (3.3.9). Les probabi- 
lités stationnaires p? ({) peuvent se déduire à partir des équations 
(3.3.11), celles-ci dans notre cas prenant la forme 


— op + Api = 0, 
AoPk—1 — (ho + kÀ) ph + (k +1) Apñri —0, 1<k<m, 
ÀoPm—1 — mp} — 0. 


Ces équations donnent: 


(Les expressions trouvées pour les probabilités stationnaires sont 
appelées formules d'Erlang.) 
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$ 4. Processus branchus 


1. Equation différentielle pour la fonction génératrice. Suppo- 
sons qu’on ait un ensemble quelconque de particules se transformant 
dans le temps en particules du même type, ce processus de « reproduc- 
tion » étant doué de la propriété suivante: durant l'intervalle £ 
chaque particule indépendamment des autres et des circonstances 
antérieures à l’instant initial, avec une probabilité p,(t) égale pour 
toutes les particules, donne naissance à nr particules. 

Désignons par & ({) le nombre de particules à l'instant £. Il est 
évident que l’évolution de la variable Ë (4) est un processus aléatoi- 
re markovien appelé processus branchu *). 

Supposons qu’à un certain instant initial s, tel que s = O0 on 
ait exactement k particules. Désignons par EE; (4) le nombre de 


particules engendrées par la i-ième particule, à = 1, . .., k, durant 
l'intervalle £. Le total de particules au bout du temps £ sera alors 
Ë (4) = bi (0) + ...+ Ex (6). (3.4.1) 


Les variables aléatoires E, (£), . . ., 81 (£) sont ici indépendantes les 
unes des autres et ont même distribution 


PH) =n}=pa(), n:=0,1, 


Supposons qu'une particule quelconque dans un intervalle de 
temps At petit se transforme avec la probabilité 


Pn (At) = 1n°hi+o(At), nr #1, 
en x nouvelles particules et reste inchangée avec la probabilité 
Pi (At) = 1 — ÀAAE + 0 (Ab). 
Supposons ensuite que À, = —À, d A4 = 0 et que les probabilités 
de transition Pa ({) = Pin S vérifient les équations différentielles 
de Kolmogorov (voir (3.3.4)) : 


37 Pa (= D hxpin (8, n=0, 1, 
k 


OÙ Pan (t) sont les probabilités de transition du processus markovien 
branchu Ë (£) (pan (é) est la probabilité pour que 4 particules dans le 
temps { donnent naissance à nr particules). 

Introduisons maintenant les fonctions génératrices 


F (£, z) — D Pn (£) z”, 
: (3.4.2) 
Fa (t, z)=— 2 Pan (£) 7". 


*) Le modele décrit peut être utilisé dans l’étude de nombreux processus 
réels (réactions photochimiques, processus nucléaires, etc.). 


11° 
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Pour chaque z, [|z2|<1,0ona 


O0 


n d d nu n … n 
D 27 Pn@)= D Pn(t = Dh D Pan(t)2", 
R 


n—0 n=0 n=0 
ce qui donne l'équation différentielle suivante pour la fonction 
génératrice À (4, 2): 
d 
GT F(t, z) = D À F,(t, z). (3.4.3) 
k 


Les fonctions F (ft, z) et F, (t, z) définies par les formules (3.4.2) 
sont telles que pour z donné elles représentent les espérances mathé- 
matiques, soit 

F(t, z) — Mai, 


Fr(e, z) = Mzi®, i= 1, .…., k, 


où &; (t) est le nombre de particules engendrées par la i-ième particule 
k 


dans le temps £et E (4) — à E;(t). Toutes les variables Es (é), i = 
ES 
— 4,..., k, étant indépendantes, on a 
M: +. -.+62(4) _ Mzi(t) _. Mzfat9, 
ce qui donne la relation suivante pour les fonctions génératrices 


envisagées : 
Fit, =1F(t, 2), k =1,2,.... (3.4.4) 


Comme F,(t, z) = 1, l'équation différentielle pour la fonction 
génératrice F (t, z) peut s’écrire sous la forme: 


D F(t,2)= Du" (t, 2). (3.4.5) 
k 


Nous allons considérer les densités de transition À4, # = 0, 
4, ..., en tant que paramètres donnés du processus branchu E (+). 
Introduisons la fonction 


f(x) = à Ar". (3.4.6) 


C’est une fonction analytique pour 0 << x << 1 et la formule (3.4.6) 
donne son développement en série entière. En vertu de l'égalité 
(3.4.5), la fonction génératrice F (t, z) est la solution d’une équation 
différentielle du type 


D = jf (x). (3.4.7) 
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Comme F (0, z) = z, la fonction génératrice F (t, z) pour chaque 
z, 0 L z L 1, coïncide avec la solution x = zx (f) de cette équation 
satisfaisant à la condition initiale x (0) = z. 

Au lieu de l'équation (3.4.7) il est commode de considérer son 
équivalent différentiel pour la fonction { = t (x) inverse de zx = x (t): 


dt 1 


di f(x)" 


La fonction { = t (x), solution de cette équation, s’écrit 


t— | M, O<r< 1. (3.4.8) 


Exemple. Supposons que les densités de transition soient 
Ào = À, À = — À, x = 0 pour À = 2, 3,.... 
Dans ce cas f (x) = À (1 — x) et 


t— Fe = — {in ({— 7) —In (1—2)]. 


A partir de cette relation on trouve facilement la fonction F = 
= F(t, 7). On a 


In (4 — À) = — Àt + In (1 — 2), 
d’où 
F(t, 2) =1—e-M( — 2). 
Les probabilités p, (t) définies à partir du développement F (f, z) — 
= D Pn (t) z° dans le cas envisagé sont 
n-_0 


Pott)—1—e-t, pift)=e-M, pi(t)=0 pour n —2,3, .... 


Exemple. Supposons que certaines particules se reprodui- 
sent par division en deux; dans le processus à ramifications cor- 
respondant il y a lieu de poser alors 


10 = 0, A4 = —À, À = À (A, = 0 pour k > 2). 


Dans ce cas 
f (x) = (x — 1) 
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Ainsi la fonction F (£, z) = 2 Pn (t) z" est définie de la relation 


ei (15) (12) 
On obtient sans difficulté 


= gt 7 Pt D Ath 
F(t,z)=e PPT EP LT e +2 (f eAt)h zh, 
On a finalement 
Po(t) =0, pat) =e-M(—e-M}tl, n=1,2,.... 


Considérons l'équation différentielle (3.4.7) où la fonction f (x) 
est donnée par la formule (3.4.6). Cette formule montre que 


f” (x) = 2 k(k—1) hxz*2>0 pour 0<z<1, 


la fonction f (x) est donc une fonction convexe et sa dérivée f” (x) 
est à croissance monotone sur l'intervalle 0 < zx < 1. La valeur 


IT) 

TT ffT)i 

À 

4 y 
/ À 
FT) 
0 / ZT 0 « / T 
a b 
Fig. 21. 


z=1Â est la racine de l'équation f(x) = 0 vu que à A4 = 0. 
R 


Cette équation peut admettre au plus une deuxième racine z = & 
et par conséquent le graphique de la fonction f (x) est de la forme 
représentée sur la fig. 21. 

Supposons qu’on ait une racine z = &, 0 <a < 1, déterminant 
une courbe intégrale singulière zx (1) = « des équations différentielles 
envisagées. Considérons la courbe intégrale (3.4.8) passant par le 
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point t=0, zx =72,  0<z<a: 


La dérivée f’ (æœ) étant finie et la fonction f (x) pour zx = « prenant 
la forme f(x) = f’ (œ)-(x — a), la valeur = pour æ—+>@ 


croît indéfiniment le long de la courbe intégrale, la courbe ne cou- 

pant nulle part l’autre courbe intégrale x (t) = &. Sur l'intervalle 

0<zxz< a la fonction f (x) est positive et par conséquent la courbe 

intégrale zx — x (ft) pour {—+ œ est à croissance monotone tout en 

restant bornée par la valeur zx = &. En tant que fonction monotone 

bornée, z(t) a une limite Bf = lim z(t), z< BP <a. Mais pour 
t 00 


x—>$ la fonction f(x) a pour 


limite f (B): # 
f(B)= lim f{z(#)]= lim" (4). ! 

1-0 + 00 Z2 

Il est clair que la valeur j (6) æœ 


doit ètre nulle, car dans le cas 
contraire la fonction 
t Z 
z(=2+ | fir(s)ds 0 : 
0 
serait pour £—> co indéfiniment 
croissante. Par conséquent, B est 
la racine de l'équation f (x) = O et coïncide avec a: B = &. Ainsi, 
toutes les courbes intégrales z = x (t), pour t = O passant par les 
points x = z, 0 < z << &, sont à croissance monotone pour { + œ et 
lim z (t)= a. (3.4.9) 
Le comportement des courbes intégrales passant pour { = 0 par 
les points x =2z, a << 1 (0 < & < 1) est tout à fait analogue, 
avec cette seule différence que zx (f) est à décroissance monotone. car 
la dérivée x’ (t) = f [x ({)] est négative (f (x) < 0 pour a <r <1). 
Sur la fig. 22 on peut voir l’allure générale des courbes intégrales 
pour les valeurs du paramètre z dans l'intervalle 0 < z << 1. 
Le cas z = 1 nécessite une étude spéciale. Il lui correspond tou- 
jours une courbe intégrale du type zx (t) = 1. 
Si pour un certain Z,&4«<Z <Âi,ona 


Fig. 22 


(3.4.10) 


he — 
Cu 
[l 
| 
8 
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(ce qui est toujours vrai pour f’ (1) < ©), alors la courbe intégrale 
du type 


passant par un point (£,, x), sera pour x —+ 1 indéfiniment décrois- 
sante, c’est-à-dire 


x 
7 _ | du 
2 4 Lo + fu) — ©. 
(2677) x0 
œ Ceci signifie que quel que soit 
| to > 0, pour z =, 0L:<1, 
on a l'égalité suivante : 
y lA L du 
(4 t (2) — = (. 
a (2) Lo + f(u) 0 
T Xo0 
On remarque (voir fig. 23,a) que 
7 7 toutes les courbes intégrales cou- 
Z pent l’axe { — Ô en un certain 


point (0, z), où 0<z<1, et 
æ par conséquent x (4) = 1 est l’uni- 
que courbe intégrale passant par 
le point (0, 1). 
Si 
1 


b dr 
Fig. 23. | 7 7 — ©: (3.4.11) 


X0 
pour {, > O0 suffisamment grand, la courbe intégrale # = 4, + 
x 


+ E= coupe la courbe intégrale x (?) = 1 en lui étant tangente 


f (x) 
X0 
en un certain point (t, 1), où 


(voir fig. 23,b). Dans ce cas, toute une famille de courbes intégrales 
z. (t) passe par le point (0, 1), chacune de ces courbes correspondant 
à sa valeur t >0. Parmi ces courbes intégrales il y en a une, x, (t), 
telle que, tout en correspondant à la valeur t = 0, elle se situe en 
dessous de toutes les autres courbes intégrales zx, (t): 


Zo (1) < z: (), 0Li< 0. 
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Ceci s'explique par le fait qu'à l’intérieur du domaine 0<r<1, 
O<t<oœo la solution de l’équation différentielle envisagée est 
unique et les courbes intégrales dans ce domaine ne se coupent pas. 
Il est également facile de voir que la courbe intégrale x, (ft) est une 
courbe limite pour les autres courbes zx ({, z) passant en dessous d'elle 
par les points (0, z) correspondants, où 0 << z< 1: 


Zo(t) = lim x(£, 2). (3.4.12) 


2. Effets de dégénérescence et d’explosion. Rappelons que la 


fonction génératrice F (4, z) — > Pa (t) À d'un processus à ra- 


mifications (où p, (4) = P {E & — k} sachant que E (0) = 1), en 
tant que fonction de £, coïncide avec la solution x (f, z) de l’équation 
différentielle (3.4:7) avec condition initiale x (0, z) = z. L'analyse 
de cette équation différentielle faite ci-dessus permet de tirer les 
conclusions suivantes sur le processus à ramifications & (£) lui-même. 

Dans le cas général. il existe une probabilité positive pour qu'’a- 
près un certain temps t il ne reste aucune particule. Mais ceci ne 
peut évidemment pas se produire si À) = 0 (c’est-à-dire si les par- 
ticules peuvent seulement se multiplier et non pas disparaître). Si 
à l'instant initial £ — O on a une seule particule, cette probabilité 
est po (t) = F(t, 0). Si au début on a Æ particules, alors cette pro- 
babilité est p, (t) = F* (t, 0) = p# (+). 

En tant que fonction de t, la ‘probabilité Po (t) est la solution 
de l'équation différentielle (3. 4.7) correspondant au paramètre 


PR 
À — 


Po () = flP()L Po © = (0. 


Nous avons montré ci-dessus que pour {—> oo cette solution 
tend asymptotiquement vers une certaine valeur p, = « qui est 
la plus petite des racines de l’équation f (x) =0 (voir la relation 
(3.4.9)), c’est-à-dire 


lim po(t) = «. (3.4.13) 
to 


Ainsi, po — &« est la probabilité de dégénérescence du processus à ra- 
mifications ËE (t) (probabilité pour que, à un certain instant, il ne 
reste aucune particule). 

Si sur l'intervalle 0 < x < 1 la fonction f (x) est positive, la 
probabilité de dégénérescence du processus à ramifications E (£) est 
égale à 1. 


Considérons maintenant l'effet d’explosion quand il y a formation 
d’un nombre infini de particules. 
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La probabilité d’explosion avant l'instant t (si au début il y 
avait une seule particule) est 


Poo (t) = 1— P {E (1) << 00} — 


— _T © P{() =n}=1- 2 Pa(t)=1—lim F (e, 2). 


Dans le cas où z pe est l'unique courbe intégrale de l’équa- 
tion différentielle (3.4.7) passant par le point (0, 1), la limite 
lim F (4, z) est de toute évidence égale à 1. Par conséquent, sous 
z— 1 
la condition (3.4.10) p., (t) = O pour tout t{, d’où l’on voit que l’ex- 
plosion est impossible. Sous la condition (3.4.11) les courbes inté- 
grales zx ({, z) pour z—+ 1 convergent d’une manière monotone vers la 
fonction zx, (t) décrite ci-dessus (voir la relation (3.4.12)), la pro- 
babilité d’explosion étant alors 


Pæ () = 1—x (1) > 0. (3.4.14) 


Il est aisé de voir que si au début on avait # particules, la pro- 
babilité d’explosion après le temps { sous la condition (3.4.10) est 
également nulle et sous la condition (3.4.11) elle est 


Pho (4) = 1 — x (+). (3.4.15) 


$ 9. Processus dans des systèmes d’attente et mouvement 
errant 


1. Processus de renouvellement. Soient E,, £+, ... une suite 
de variables aléatoires, positives indépendantes de même distribu- 


tion et 
Sn = 1 + Est... + En. 


Nous allons convenir qu’il existe un certain appareil de durée de 
service £,; une fois tombé en panne (après un temps aléatoire E;) 
cet appareil est remplacé par un nouvel appareil tombant à son tour 
en panne après un temps aléatoire E, et remplacé par un nouvel appa- 
reil, et ainsi de suite. Dans une telle interprétation il est naturel 
d'appeler les variables S,, r — 1, 2, . . ., instants de renouvellement. 

Dans ce processus de renouvellement S,, nr = 1, 2, . .., nous nous 
intéresserons principalement aux valeurs v (f), nombre de renouvelle- 
ments dans l'intervalle de temps [0, #]. et n (t), délai restant de ser- 
vice d’un nouvel appareil fonctionnant à l'instant t. 

Nous allons supposer que les renouvellements ont lieu à des ins- 
tants discrets t — khk multiples d’un certain k > 0 (par exemple 
hk — 1). Par conséquent, il y a lieu de préciser l'instant auquel l’appa- 
reil en panne est remplacé. En ne considérant que les valeurs entiè- 
res { > 0, on va supposer que si un appareil tombe en panne dans 
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l'intervalle [f, # + 1), il est remplacé par un nouvel appareil à 


Supposons ainsi que les variables E,, k — 1, 2, ..., prennent 
les valeurs entières x = 1, 2, . .. avec les probabilités correspon- 


dantes P (x), Ÿ P (x) = 1. 


î 
Désignons par Ë (tft) la durée de fonctionnement d’un nouvel 
appareil à l'instant t: 


EU =t— Su. (3.5.1) 


A l'instant suivant t{ + 1 l'appareil soit tombe en panne et se trouve 
remplacé par un autre appareil, dans ce cas E (t + 1) = 0. soit con- 
tinue de fonctionner et E ({+ 1) = E (t)+1. Si l'appareil a fonc- 
tionné pendant un temps zx, il se trouve en panné après une unité 
de temps et est remplacé par un nouvel appareil avec une probabi- 
lité conditionnelle égale à 


gt) =PH=rti[h nr) 29. 


z—0, 4, ... (3.5.2) 
Y P(y) 
y X+i 
Le processus aléatoire 


ë (0) —+ E (1) E (2) —+ 


est une chaîne de Markov du type étudié précédemment (voir l’exem- 
ple à la page 152) lorsqu'il est possible de passer de l’état x soit à 
l'état suivant x + 4, ce qui se produit avec la probabilité 


G 1 
p(r=1—q() =, z—0,1,..., (3.5.3) 


soit à l’état « initial » O, ceci avec la probabilité q (x) définie parla 


formule (3.5.2); dans l'expression (3.5.3) G (x) = Y P (y) est la 
y=x+1 

probabilité pour que la durée de service de l’appareil soit supérieure 
à x. Evidemment, pour un certain t (E (t) = 0) l’arrivée dans l’état 0 
signifie le renouvellement à l'instant {; le temps de retour à l’état 0 
n'est autre que la durée de service d’un appareil ; le nombre de re- 
tours à l’état 0 dans l'intervalle (s, {] est égal au nombre de renou- 
vellements dans l'intervalle compris entre s et £, etc. 

Nous avons déjà établi pour notre chaîne de Markov E (4) dont 
les états sont z = 0, 4, ..., que si le temps moyen u de retour à 
l’état O est fini, on a une distribution stationnaire (3.2.25) : 


p(0)p(1)... p(r—1) 


z=1,2,..., 
H 


p(O)=+, p'(à= 
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qui pour les probabilités de transition p (x) — ru , ZT = 
= 0, 1, ..., s'écrit 
p* (x) — 2. z=0, 1,...; (3.5.4) 
le temps moyen de retour u = > G (x) coïncide alors avec la durée 
=0 


moyenne de service d’un appareil : 


cP(x)= À z16(—1)—6G (x) = 
—(G(0)}—G(1)]+21G(1)—6G(2)1+31G(2—G(G3)+...— 


à 
LS | 


— > G(x)=H: (3.5.5) 


Rappelons que G (x) est la probabilité pour que la durée de ser- 
vice d’un appareil soit supérieure à z; supposons que pour z— co 
G (x) décroisse suffisamment rapidement à savoir 


G(z+ 1<aG(x), oùa<1. (3.5.6) 


1 G(z+1) 
CE 
ne sont pas inférieures à 4 — &« => 0 et par conséquent le coefficient 
d'ergodicité de cette chaîne de Markov sera positif : 


k (1) > 1 — a. 


Dans ce cas, toutes les probabilités de transition g (x) 


Sous cette condition les probabilités p, (rx) = P {E (8) = x} pour 
{—> oo convergent vers les probabilités stationnaires p*(x) : 


lim pi (x) = e , Z=0, 1,..., (3.5.7) 


de plus, pour la vitesse de convergence on a l'estimation suivante 
(voir théorème 4, $ 2 du présent Papiers 


G © 


Pt (x) — <— era, (3.5.8) 
Considérons le nombre moyen de renouvellements dans l’inter- 
valle compris entre £ et {+ s (autrement dit, le nombre moyen de 
retours à l’état O), soit: 
t+s 


n(t+s)—n(D=MI(+S) ve à Pa (0) 


(précédemment nous avons désigné par v (t) le nombre de renouvelle- 
ments dans l'intervalle de temps compris entre O et t). Il est mani- 
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feste que pour tout intervalle borné (f, £+ s] on a 
n(£+s)—n(t) + pour {—>co, (3.5.9) 
car Pu (0) — + et de plus, comme il ressort de (3.5.8), 


In (t+s)—n(#)] + <— et, (3.5.10) 


La relation (3.5.9) montre que pour un processus de renouvelle- 
ment durable le nombre moyen de renouvellements dans l'intervalle s est 


« « Lé % S a Cd e 
à peu près égal à la grandeur T'aüu est la durée moyenne de service 


d'un appareil. 

Il a été convenu de considérer que si l’appareil fonctionne à 
l'instant t (multiple de h), il n’est remplacé qu'au bout du temps 
h (k = 1). Soit 

n () = Su — k — (3.5.11) 


le temps que dure le fonctionnement de l'appareil après l'instant £, 
Syc+1 étant l'instant de renouvellement immédiatement après t 
(instant où l'appareil envisagé est remplacé). 

Il est intuitivement clair que lorsque le processus de renouvelle- 
ment est durable (£ — co), la distribution de la variable n (+) doit 
être approximativement la même que celle de la variable E ({) = 
— t— S,u,, ceci vu la « réversibilité » du processus de renouvelle- 
ment : les instants de renouvellement peuvent être considérés dans 
l'ordre inverse (le nombre de renouvellements n = v (t) croît indé- 
finiment et les variables Si = E,, 35, — E, + E,, ..., S, = 
= E1 + . + En et S! — En; S; — En + En+1 EL Sn — 
= PL . + &, ont même distribution simultanée). 

Notons que dans le cas où le temps d'attente d'une panne de 
l'appareil est réparti suivant une loi exponentielle 


G(x) = e-, x = 0, 1, 
on a déjà dès le début 
P{n(t)=7z}= 


(voir chapitre IT, $ 2, p. " 
Donnons une argumentation rigoureuse du fait que la variable 
n (é) pour t —+ oo a pour distribution limite la grandeur 


lim P {n (9 = 2} = 2, z=0, 1,.... (3.5.12) 


<@, z=0, 1, . (u=——) 


Posant Sos —0, on a 


P {n(t) == 2 P{Sa<t, San=t+1+7x}, 
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où (d’après la formule des probabilités totales) 
P{Sa<t, Say=t+1+zr}= 
= À P{Snu=t+1+z|Sn=s} P{Sr=s}=— 


oÉTet 
= 2, P {Enu=t+1+z—s}P {S1=s}— 
= 2, PE+4+z—s) P{Sn= 5}. 


0-Ls< 


On voit que 
P@=z= D Pt—s+1+2) p.(0)= 
= 2.,P (u+1tzr)pru (0),  (3.5.13) 
car 


À P{Sa—s}= P {E(5)—0} — p. (0) 


est la probabilité pour que s soit l'instant de renouvellement. Comp- 
te tenu de ce que 
t 
D Pu+1+2)+G(2) et pru(0) ++, 
u=—0 


pour é — oo, on obtient la formule (3.5.12) à partir de l'égalité 
(3.5.13). 

Considérons maintenant le rombre de renouvellements v (£+ s)— 
— v (#) dans l’intervalle de temps (f, & + si. Il est évident que 


P{v(t+s—-v( =0}=P {nt >s}, (3.5.14) 


et pour x = À, 2, ... la probabilité conditionnelle pour que dans 
l'intervalle (£, 2+ s] on ait nr renouvellements, à condition que le 
premier se produise à l'instant {+ u<+ kh, est 


P{vt+s)—v()=n|n()=u}= 
0, UZS, 
D Phtio-vtrur Dent US. 
En utilisant la formule des probabilités totales on obtient 
P{v(+s)—v(1)=n}— 
= 2,,PUE+S—v(É+u+1)=n- LP {n(t)= "}, 


ce qui avec la formule (3.5.14) nous donne des relations de récurrence 
pour la distribution du nombre de renouvellements dans tout inter- 
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valle (t, £+ sl. En particulier, pour les probabilités limites 
P,(s)=limP {vt+s)—v(t)=n} (3.5.15) 
t— co 


on a les relations de récurrence suivantes : 


Po(s)=+ 5 G(u), 


uZ>s 


Pa (s)= + SO Pyu(s—u—1)G{u), n=1, 2, .... 


0O<u<s 


(3.5.16) 


Remarquons que les distributions des variables 
EE) = 1— Siyuy n () = Suursss —t—h, v (+ Ss)—v() (3.5.17) 


coïincideront avec les distributions stationnaires limites (décrites 
par les formules (3.5.7), (3.5.12), (3.5.16)), si le premier appareil 
avant l'instant initial £ = O a déjà fonctionné pendant un certain 
temps aléatoire Ë (0), la variable aléatoire E (0) ayant une distri- 
bution stationnaire P {E (0) = x} = G (x}/u, x = 0, 1, .... 


Notons en conclusion que les résultats obtenus ci-dessus sont 
également vrais dans le cas général *). En particulier, pour des 
composantes à distribution continue E,, £., . .. de densité de pro- 
babilité p (x), les distributions de variables correspondantes 


ë (£) =  — Svtty n (#) — S'yc+1 — Î 


convergent faiblement vers la distribution limite de densité de 
probabilité | 


p° &=, 0Sz< oo, (3.5.18) 
où 
G(xz) = | p(y)dy, u— | xp (x) dr — | G(z)dz. (3.5.19) 
x 0 0 


2. Suites de sommes des variables indépendantes. Distribution 
du maximum. Dans ce point nous allons considérer certaines pro- 
priétés des suites de sommes 


Sn= JE, n=1,2, ..… (3.5.20) 
h=—1 


des variables aléatoires indépendantes E, de même distribution. 
Pour une représentation concrète, on peut imaginer qu'une certaine 


*) A ce sujet (ainsi que pour les pp. 2, 3 ) voir par exemple W. Feller, 
An introduction to probability theory and its applications, vol. II, Wiley and 
Sons, New York, 1966. 
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particule animée d’un mouvement errant sur la droite réelle se dé- 
n 


place à chaque pas d'une grandeur égale à £,, alors S, = à Ez, 
k=1 


n = 1,2, ... (S, = 0), sera la trajectoire de ce mouvement aléa- 
toire. Nous allons supposer que les variables £,, E., . .. ont une 
espérance mathématique « non nulle telle que 
a — ME, < 0. 
En vertu de la loi forte des grands nombres 2 a << 0; par 


conséquent, avec la probabilité 1 
Sn —> — © pour 7 —+ oo, 


et il existe un v dépendant du hasard pour lequel $, << O0 pour tous 
les n > v. Ceci montre que le maximum 


t = max (So, S1, ...) (3.5.21) 


de la trajectoire du mouvement errant est une variable finie coinci- 
dant avec la valeur maximale de la suite S,, S,, . .., 4S.. 

Nous allons trouver ci-dessous la relation entre la distribution 
de cette variable £ et un certain processus de renouvellement 
S$, SŸ, ... obtenu à partir du mouvement errant Sy, S3, ... 
(voir plus loin (3.5.31)), ce qui permettra de trouver les formules 
explicites (3.5.37), (3.5.40) ainsi que la formule (3.5.41) qui seront 
utilisées lors de l'étude des systèmes d'attente. 

Posons 


So = 0, S = £, Sr =te+ bn ... 
et : D 
Ë = max (So, Sy, . . .). 
Manifestement, la variable aléatoire a a même distribution que la 
variable aléatoire £. Il est évident que pour tout z > 0 l'événement 
{È< z} a lieu si et seulement si E, < z et ÉL z — E. Comme la 
variable £ ne dépend pas de E,, on a pour tout Ë; = z (x < 2) fixé 
PHSz—E IE} = Fez — &), 

où F};(z) = P {£< z}est la fonction de répartition de la variable 
&, ainsi 


P c E 0 si h>z, 
Z = . 
{<< | 1} Fr: (z—E) si EL. 
Tenant compte du fait que pour la variable non négative © la 


fonction de répartition F}(z), pour z << 0, est nulle, la relation 
obtenue ci-dessus peut s’écrire comme suit : 


PE<z1h} = Fi: — bi). 
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En utilisant la formule des probabilités totales (voir (1.4.20)), on 
obtient finalement pour F}(z) l'équation suivante: 
Fi) = MF;:(c—&,), z2>0. (3.5.22) 
Pour les variables discrètes E,, E., ..., cette équation signi- 
fie que 


F@= 2 FR G—2) Pare L Pas F;(y), (8.5.23) 


et lorsque les variables E,, E4, . .. ont pour densité de probabilité 
Paz: (x), on a 
F;(2— 2) pa (x) dr = | Pa (2—y) F(y) dy. (3.5.24) 


0 


F3 (2) = 


g 2" 


Montrons qu'avec une probabilité positive g > 0 on a l’événe- 
ment {€ = 0}: 


g=F:0)>0 (3.5.25) 


(c’est-à-dire en partant du point x = 0 la particule avec la probabi- 
lité 49 0 ne tombe jamais sur le demi-axe positif z > 0). 

En effet, supposons le contraire. Désignons par z, la borne infé- 
rieure des z tels que F: (z) > 0; en vertu de notre assertion on a 
soit 3, >> 0, soit zo — Ô et F; (0) = (0. Si z, > 0, alors pour tout 
2, 0 Z2< 20, à Pi de ré iion (3.5.22) on obtient 


Fi) = MF; —E,) —0. 


Il est évident que pour une variable non négative F:(z — E,), 
F(:—E) >0 pour z—E > z, l'égalité donnée n est valable 
que si, avec la probabilité 1, z — E< 2, 1 > z — zo, d’où l’on 
déduit que pour z, > 0 avec la probabilité 1 E, > 0. Mais ceci con- 
tredit notre condition initiale a = ME, << 0, donc, on doit avoir 
Zo = 0. D'une manière analogue, l'hypothèse F; (0) = 0 dans le 
cas Z9 = 0 se trouve en contradiction avec la condition ME: < 0. 

La variable € prend une valeur stricte positive avec la probabili- 
té p = 1 — q. Ceci montre que dans le mouvement errant envisagé 
la particule avec la probabilité p se posera tôt ou tard sur la partie 
positive de la droite réelle; désignons par E* la position de la par- 
ticule lors de sa première arrivée sur l’intervalle (0, co). La varia- 
ble E* existe seulement avec la probabilité p: 


P {5 € (0, )} = p (=1— 9) 
(nous allons convenir qu'avec la probabilité g = 1 — p la variable 
E? « disparaît »). 


Désignons par t; l’instant d'arrivée de la particule sur l’inter- 
valle (0, co); t; = v*, où v? est le nombre de pas avant que le dé- 


12-0521 
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placement de la particule devienne positif: S, — S,< 0 pour 
RU, Su — So = Er > 0. 

Posons SŸ = S:,. Après l'instant t;, le déplacement de la par- 
ticule suit la même loi qu'après l'instant initial t, — 0. En parti- 
culier, à un certain instant Tt, (après un certain nombre aléatoire 
de pas V? = Te: — T,) avec la même probabilité p — 1 — g comme 


précédemment, la particule arrive au point S? = S:. à droite du 
point initial SŸ (vw est le nombre de pas après l'instant % avant 
que le déplacement de la particule redevienne positif: S, — S*< 0 


POUrT NT To, Sr — 97 = Ez >> 0). Ce même fait est observé à par- 
tir de l'instant tr, = vi + vi, c'est-à-dire que la particule avec la 
probabilité p à un certain instant +t, (après un certain nombre aléa- 


toire de pas v5 = T3 — 1.) arrive au point S% = S+, à droite du 
point initial s* (v$ étant le nombre de pas après l'instant T, avant 
que le déplacement soit de nouveau positif: S, — S* 0 pour 


n LT Sr — 93 = ES >> 0). Le prolongement de ce processus 
conduit à la suite de sommes S5 = S+, 


St= NE, n—1,2,..., (3.5.26) 
k=1 
des variables aléatoires positives E%, 4 — 1, 2, . .., où Eh est le 


déplacement de la particule (après la sortie du point S$) à l'instant 
Tx+1, lorsque ce déplacement devient pour la première fois positif : 
Sn — SR <O pour n<'T+H1 Sony — SR = ER+1 > 0 

Les variables Ë,, E.,, . . . étant indépendantes et de même distri- 
bution, la particule après son depart du point initial S$ se déplace 
suivant la même loi qu’à son départ du point S% = 0 (ceci indé- 
pendamment de son comportement avant l'instant t:); c’est pour- 
quoi les variables E*, £*, . .. que nous avons définies sont indépen- 
dantes et ont même distribution. 

Conformément à la terminologie utilisée au point 1, la suite S*, 
n = 1, 2, ..., est un processus de renouvellement. Le premier 
instant de renouvellement S* n'existe alors qu'avec la probabilité 
P {STE (0, œ)}=p, de plus, dans le cas général, lorsque les ins- 
tants S*, ..., S3-, existent, l'instant de renouvellement suivant 
SA l'est seulement avec la même probabilité p, soit : 


P {Sn € (0, oo) | 57 € (0, o)} = p. 


On en déduit pour la probabilité P {S%+1 € (0, æ)} d'existence 
du (7 + 1)-ième instant de renouvellement S%;1 que 


P {S%+1 € (0, co) } — 
= P {5341 € (0, oo) | 5% € (0, œæ)} P {5% € (0, o)} = 
= p.P {SE (0, c)}, nr = 1, 2, ..., 
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et finalement 
P {5% € (0, co)} = p", n =1,2,.... (3.5.27) 


La série S P {$3 € (0, )} étant convergente, en vertu du lem- 


me de Borel-Cantelli seul un nombre fini d'événements {S3 € (0, )} 
se réalise avec la probabilité 1, c'est-à-dire que le processus c renou- 
vellement Sn n = 1,2, ..., s'arrête à un certain pas fini. Il est fa- 
cile de voir qu'avec la probabilité g = 1 — p il n’y a aucun renou- 
vellement, et avec la probabilité p (1 — p)il n’y en a qu’un seul 
sur tout l'intervalle infini [O, co), de plus, le processus de renouvelle- 
ment S%, n = 1, 2, , S'’arrête en général après nr renouvellements 
avec la probabilité p” (A — p). Posant S5 — 0 et supposant que S* 
est également un instant de renouvellement, on obtient pour un to- 
tal N de renouvellements (sur tout l'intervalle infini [0, œ)) une 
distribution géométrique : 


P{NZDn}=P {551€ (0, o)} = p"i, 
P{N=n} = gp", = 1, 2,....  (3.5.28) 


Désignons par NW (x) le nombre de renouvellements dans l'inter- 
valle [0, x], O <I< co. Il est évident que 


P {N(2)>n} =P {S3€l0, xl} 


et que la valeur moyenne 4 (x) = MIN (x)]l est (comparer avec 


(3.5.5) : 
M (x) = 2 PIN(z)>n}— > P{S*E(O, r]}.  (3.5.29) 


Pour le total de renouvellements À on a 


es) co : | 
MIN] — 2 P {N>n}= D P =. (3.5.30) 
Evidemment, la variable 6 — max (0, S,, S,, ...) qui nous 


intéresse coïncide avec la valeur maximale de la suite 0, 57, S%, ... 
à croissance monotone, autrement dit avec le dernier instant de 
renouvellement SŸ$_1. Donc, pour tout x > 0, il vient: 


P{0< t<z}= à P{VN=n, Si_1€1[0, x]}. 
On a 
P{N=n, S%_1€El0, xl} = P {S%-1 El0, IN =n}P(N = n), 
où l'événement {NW = n} signifie que (Sn-1 € (0, œ)} et que 
la variable E£? disparaît. Mais S9_1 — DE ne dépend pas de 


12* 
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En (Eï, Es, . .. étant une suite de variables indépendantes) et il 
est donc facile de voir que 
P {S%-1 El0, I IN =n}=P {S%:€[0, xl | Si1€ 
€ (0, co)}. 
Les formules (3.5.27), (3.5.28) obtenues ci-dessus permettent de dé- 
duire que 
P {S2-1 € 10, z]|Sn-1 € (0, o)}P{N =n}=— 
= RD El P{N = n}=gP (5%1€(0,2)}, n>1. 
Compte tenu de l'égalité (3.5.29), on obtient finalement la relation 
F;(z) =qM (x) (g = F: (0)). (3.5.31) 


Pour la fonction M (x), nombre moyen de renouvellements dans 
l'intervalle [0, x], on a la formule (3.5.29) dans laquelle 


P {S$ € [0, xl} = F°* (x) = 1, 
et pour nr > 0 
P {SE I[0, xl} = F"* (x), 0<Lz< o0, 


est la fonction de répartition de la somme des variables indépen- 
dantes de même distribution E?, ..., &%. Connaissant la fonction 
de répartition F* (x) = P {E? < zx}, on peut en principe définir 
encore 


M (x) = > F* (x), 0Sz<o (3.5.32) 


(FT*% (x) = 0 si z < 0 pour tous les nr = 0, 1, ...). 


Nous allons établir une relation très utile qui dans le cas de la 
distribution exponentielle des variables initiales E,, E,, ... per- 
mettra de trouver des expressions explicites pour la distribution des 
variables £* (voir (3.5.35) et les suivantes). 

Notamment, dans le mouvement errant initial (3.5.20) la va- 
riable E* traduit la position de la particule lors de sa première arri- 
vée dans l'intervalle (0, co): EŸ = S+:,, où 7, est le nombre de pas 
avant la première arrivée de la particule dans l'intervalle (0, oo). Il 
est évident que pour tout zx >0 on a 


P {tu = n, Et >œz}=P {S<0,..., Sr1 < 0, Sn > x}, 
et pour Si < 0, . Sn 4 <?° fixés, l'événement {t; = n, E* > 
> z} signifie que E, = Sn — S$n41>T— S:_. Par conséquent, 
P{u=nr Ex a ses Sn} = Gr (Z — Sn) X 
X X(S1Z0, . . .,Sn-1S0}» 
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où Gr, (x) = 1 — Fa, (x), Fr, (x) est la fonction de répartition des 
variables E1, Ee, . .. et Xis<o, ... snuco) 12 variable indicatrice 
de l'événement *) {S, 0, ..., S,-1 KO). La formule des 
probabilités totales donne 


P{u=n, EE >z}=MIG:,(z— Sn) Xsiso, ..., Snco)l,  (3.5.33) 
n=1,2,... ;:xz >0. 


Supposons que chacune des variables E,, Ë., . . . sur l'intervalle 
(0, co) soit répartie suivant une loi exponentielle : 


Gu(z)=P{h>z)}= 4e, 120, (3.5.34) 


où A —P{E > 0}. Dans ce cas la relation (3.5.33), où S,_1 ne 
figure que si S,_, 0, donne les égalités suivantes: 
P {t: = D, E’ > x} —= M [Ae—}x-2Sn-1X 5, <0, ...: Sn-1<0)] — Bert, 


« 


où 
By = M{Ae- ns, <0, ..., Sn<0)] : 


par la sommation de ces égalités pour tous les nr = 1, 2, ... on 
obtient 
P{E>z}=pe"#, 220, (3.5.35) 


où la constante p = >, B, est de toute évidence 
n= 1 


p=P{>0}=1—g (9=F(0)). 


Considérons plus en détail le cas des variables E,, E,, ... à 
distribution continue (pour les variables discrètes les résultats se- 
ront analogues). En vertu de la formule (3.5.35) pour la densité de 
probabilité 

Pi (x) — Alex, Zz > 0, 


les variables E?, E, ... seront réparties suivant une loi exponen- 
tielle avec une densité de probabilité 


p* (x) = phe-&, z> 0, (3.5.36) 


ne différant de la densité exponentielle ordinaire que par le facteur p 
indiquant que la variable E* « disparaît » avec la probabilité qg = 
— 4 — p. Comme nous l’avons montré précédemment (voir (2.2.16)), 
la somme des variables indépendantes E*, ..., EA réparties sui- 
vant une même loi exponentielle (3.5.36) a pour densité de proba- 


*) Rappelons que la variable indicatrice d’un événement À se définit 
comme suit: 
._ _ f1 lorsque l'événement se réalise, 
#A 10 dans le cas contraire. 
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bilité : 
ns LA (Ar)"-1 x 
p'* (x) = p'À mn x > 0. 


La densité de probabilité p"* (x) est la dérivée de F"° (x) et par 
conséquent 


m (2) = 5 p"* (x) = phe- => CD  phe-Mi-ns, 250, 


n=1 


est la dérivée de la fonction M (x) = à Fr* (x) (M (0) = 1) et 
x ; l 
M (x) = 1 + | m(x) dr =-(1— pe 4x), qg—1—p 
0 


Finalement, à partir de (3.5.31) on obtient que 
la fonction de répartition du maximum & = max Q, Sy, Sos + + +) 
prend la forme : 


Frs) =1—-({1—ge", 1:20, (3.5.37) 
où la probabilité q = F} (0) peut être déterminée à partir de l'équation 
(3.5.24), soit : 


0 
_ | Li — (1 — ge] pe (x) dz. (3.5.38) 


Dans le cas où pour x < 0 la densité de probabilité suit la 
même loi exponentielle que pour x > 0, à savoir 

pas(r) = Buenx, zx<0, (3.5.39) 

à partir de l’équation (3.5.38) on déduit facilement que g = L _ 


— +; compte tenu de l'égalité B = P {ki < 0} = 1 — À on a 


g=B—At.. (3.5.40) 
Notons que dans le cas envisagé ME, — —* + £ et l’on voit immé- 
diatement que pour ME; << 0 la valeur mentionnée qg = —uME; est 


rigoureusement positive. 


Revenons au cas du mouvement errant général (3.5.20), en sup- 
posant comme précédemment que ME, < 

Nous allons montrer que l'espérance ahématique de la grandeur 
Vo, nombre de pas avant la première arrivée (après le départ du point 
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Sy = 0) dans le domaine x < 0, est finie: Mv, << © ; de plus, 
1 
Mvo= (q = F: (0)). (3.5.41) 


Nous avons noté tout au début que la grandeur v, est finie avec 
la probabilité 1 (rappelons que $S, —> — o pour nr -> ©). Pour 
démontrer l’égalité (3.5.41), considérons les événements 


An = {Sn >0, Sr > Sy, ..., Sn > Sn}, n = 1, 2, .... 


Il est évident que chacun d’eux signifie que $, est l’instant de re- 
nouvellement dans le processus de renouvellement (3.5.26). Compte 
tenu de la coïncidence de tout instant de renouvellement dans 
(3.5.26) avec une certaine valeur $, et en introduisant un événement 
certain À, désignant que S® = S$, est également un instant de re- 
nouvellement, on aura pour le total de renouvellements # et la 


valeur moyenne M [NW] que N = À # An OÙ Xa, est la variable 
n=0 


indicatrice de l'événement 4, et 
.. 


œ ; _ 

M [NW] = 2 MX,, = 2 P (Ah) == 7 (3.5.42) 
(voir (3.5.30) et (1.4.39)). En introduisant les variables S, = $S, — 
— Sr, k = 1, ..., n, telles que 


S,:= En; S, = En + En-1, ..) Sn = En +... + Et, 
ayant la même distribution que les variables 
S1 = Ep, So = Ep + Bo, . .., Sn = +... HE, 


on remarque aisément que chacun des événements À, coïncide avec 
l'événement correspondant {S, > 0, ..., Sh > 0} ayant la même 
probabilité que l'événement 


By ={8>0,..., Sn >0}, n—1,2,.... 


Mais chacun des événements B, signifie que durant les nr premiers 
pas la particule n’a jamais visité le domaine x < 0, c’est-à-dire que 
By = {vo>n}. Compte tenu de P (B,) = P (4,), n = 0, 1, ..., 
l'espérance mathématique de la grandeur positive v, en vertu de 
l'égalité (3.5.42) est 


Mo= À P{o>n}= D P(4)=—. 
n=0 n=0 
La formule (3.5.41) est donc démontrée. 


3. Processus aléatoires dans les systèmes d’attente à un canal. 
Soit un système d’attente recevant des demandes à des instants aléa- 
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toiresS T4, Te, . . . . SUpposons que le service simultané de diffé- 
rentes demandes soit impossible et que les intervalles &, = +, — +:, 
Eo = Ta— Te, . .-. entre les instants ti, T+, . . . soient des varia- 


bles aléatoires indépendantes de même distribution. Supposons éga- 
lement que le service de la n-ième demande prenne un temps n, et 
que My; M», - - . Soient des variables aléatoires indépendantes, sans 
dépendre non plus des instants T,, Tt., . . . et réparties suivant une 
même loi (on suppose que n, est le temps utile de service de la n7-ième 
demande, sans tenir compte de la durée aléatoire d'attente S£, com- 
prise entre l’instant d’arrivée de la demande 7, et le commencement 
du service). ; 

La durée totale de séjour de la n-ième demande dans le système 
d'attente est dans nos désignations &£, + n,. Supposons que si la 
(n + 1)-ième demande arrive après le temps E, > 4, + n,. elle 
trouve le système disponible et le service commence immédiate- 
ment, c'est-à-dire d£n+1 — 0; si au contraire E, << d#£, + n,. alors 
à l'instant Thr1 = Th + E, le système est encore occupé par le ser- 
vice des demandes précédentes et la (r7 + 1)-ième demande reste 
dans la file d'attente pendant far = En + Mn — En avant le 
commencement du service. 

Nous nous intéresserons aux lois régissant un processus d’attente 
long et avant tout à la distribution de la variable &£,, durée d’atten- 
te de la n-ième demande (pour 72 —> co) avant le commencement du 
service. 


Posons 
ñn 


An=Mn—ËEn; Sn= DD Ar, n=1,2, ....  (3.5.43) 
R=1 


Comme nous l’avons déjà mentionné, les variables &£,, sont liées 
aux variables aléatoires indépendantes A, (n = 1, 2,...) par les 
relations suivantes: 


0 pour fn + An<0, 

— — 3.5.44 

Hi nu PE n + An pour Sn + An > 0. (3.5.44) 

Comparons les suites 4%,, 2, . .. et S,, S,, . .. Désignons par 

Vo. V1, ... les n valeurs successives pour lesquelles ,+, — 0. 

n > 1. L'événement v, = 1 signifie que {S, < O0} et à partir de la 

relation (3.5.44) on voit que dfn+1 = SA pour 1 < nr <v9 — 1 et 

{M =m})=4{5 >0,..., Sm1>0, Sn <O}, m> 1. 

(3.5.45) 

Par conséquent, pour 1<<n<m, m = V,, la relation entre S£,+: 
et S, peut s'exprimer sous la forme : 


Beni = Sn — min (0, Sy, ..., Sn). (3.5.46) 
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Pour m<n<V, m = Vo, les variables 2,4, et S, avaient, lors 
de chaque pas rx, le même accroissement A,, c 'est-à-dire Sn — 
— Flmtri = Sn — Sm > 0, où | 

PE m1 = 0, Sm = min (0, Sy, .-.., Sn). 


Ainsi, tout comme dans (3.5.46), ns = S, — min (0, S:, ... 
. S,). Pour n = v, on a G£h + À = ($, n-1 — Sm) + An = 
= S, — Sn < 0, d'où la formule (3.5. 46) donnant A n+1 = 0 reste 
toujours vraie. Il doit maintenant être clair que cette formule est 
valable pour tous les n = 1, 2, 
Considérons les suites de sommes S, = An, S;, = An + 
+ An, ..., Sn = An +... + A, des mêmes variables aléa- 
toires indépendantes AÀ,, ..., A, que celles de (3.5.43), mais pri- 
ses dans l'ordre inverse. On a 


Si = Sn — San k =1Â1,...,n, (3.5.47) 
et de toute évidence 
max (0, S:, ..., Sn) = Sh — min (0, Sy, ..., Sn) = 
(3.5.48) 


La distribution simultanée (S°, ..., Sh) étant la même que (S,, ... 
.… Sn), on obtient donc le résultat suivant. 


Lemme 1. Les distributions des variables G8h et 5 — 
— max (0, S,, ..., S,) sont identiques. 


Soit a l'intervalle moyen de temps entre les arrivées successives 
des demandes (a — ME;) et b le temps moyen de service d'une de- 
mande (b = Mni). 

La valeur moyenne des variables A, = nn — Eh, n = 1,2, 
est égale à b — a. Si 


MA: = b—a<O0, 


alors, comme nous l'avons montré au point 2 précédent, la variable 
6 — max (0, S,, S+, ...) avec la probabilité 1 est finie. 

La suite de variables &, — max (0, S,, ..., S,), r = 1,2, ..., 
est à croissance monotone et converge vers & = max (0, Si, S2, . . .). 
Il est évident que l'inégalité Ê < x équivaut à &, < x pour tous 
les n = 14, 2, .... De plus, les événements 4, = {&, < x} for- 
ment une suite monotone À, = À, = ...et, vu la continuité de la 
probabilité de l'événement À = {£ < x} coïncidant avec l'inter- 
section n An, on a P (4) = lim P (4,). 


Ce qui avec le lemme 1 donne le résultat suivant. 


Théorème 1. Si 
ME, = a > b = Mn, (3.5.49) 
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la distribution des variables GÆ, converge vers la distribution du mari- 
mum & = max (0, Si, So, . . .), c'est-à-dire pour tout x on a 


P {Sn <z}— F};(x) pour n— 0. (3.5.50) 
(Rappelons que la fonction de répartition F} (x) du maximum de la 
suite 0, S,, S:, ... des sommes des variables aléatoires indépen- 


dantes a été considérée au point 2 précédent.) 
Pour compléter le théorème 1, notons que si 


MA, =b—a>0, 
alors, en vertu de la loi forte des grands nombres, 2 + MA 
S, — oo avec la probabilité { et par conséquent 
En = max (0, S,, ..., Sh) — oo. (3.5.51) 


Pour les variables 4, obéissant à la même loi de répartition que les 
variables &,, il résulte à partir de la relation (3.5.51) que 


P {Æ,h > z}— 1 pour nr —+ (3.5.52) 


pour tout x aussi grand que l’on veut. Grossièrement, ceci signifie 
que le temps d'attente avant le commencement du service des de- 
mandes c%,, n —+ oo, arrivées assez tard, sera, avec une probabilité 
voisine de 1, infiniment long. 


Exemple. Supposons que le temps de service d’une demande 
suive une loi exponentielle de densité de probabilité 


ex, x>0, 


Pn, = O, z<0, 


et soit p. (y) la densité de probabilité de la variable Ë, (pe, (y) = 0 


pour y << 0). Alors, la somme A, == n, — E, des variables indépen- 
dantes n1 et —E, a pour densité de probabilité 


0 oo 
p(o= | pate 1) pau) dy = | pa, (2 +) ps, (u) dy, 
— © 0 
qui, pour z > 0, est donnée par la formule 
ptr)= [he-ep, (y)dy= Alex, 250. 
0 


où 


A= | e-ps (y) dy = P {M > 0}. 
0 
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Comme nous l'avons établi précédemment, la fonction de réparti- 
tion F;(x) est dans ce cas décrite par la formule (3.5.37), à savoir 


F;:(z2)=1—({1—ge-4x, z>0. 


Si le temps d'attente d’une nouvelle demande suit également 
la loi exponentielle 


ue”, z20, 
Py: = 0, z<0, 
la densité de probabilité p (x) pour x << 0 sera 
p (x) = Buerr, 
où B =P {A, < 0} = 1 — À, de plus pour la densité p(x) men- 
tionnée on a 


_ _H LE 
A= A+ ! B— A+u 


D'après la formule (3.5.40) la probabilité qg = F: (0), qui pour nr 
grands est approximativement égale à la probabilité pour que la 
n-ième demande trouve le système disponible, sera 


BAL 4 HE 
qg=B A =1 L- 


(Rappelons que l’intervalle moyen entre les instants d'arrivée des 
demandes est a — ré le temps moyen de service d’une demande est 


= ? et la condition (3.5.49) du théorème 1 signifie que À > y.) 
Revenons au schéma général en supposant vérifiée seule la con- 
dition (3.5.49) et considérons la période d'indisponibilité du système 
de service, c'est-à-dire l’intervalle compris entre l'instant d'arrivée 
de la première demande et l'instant où il devient disponible. 


Si v, est le total de demandes servies pendant la période d’indis- 
Vn 


ponibilité, la durée de cette période sera T = à n:. La relation 
k=1 
(3.5.45) montre que v, coïncide avec le nombre de pas antérieurs à 
n 
la première arrivée de la suite $, = à An, nn = 1,2, ..., dans 


le domaine x < 0. Comme nous l'avons montré au point 2 précédent, 
sous la condition (3.5.49) la variable aléatoire v, a une espérance 
mathématique Mwv, finie égale à + (g = F; (0), voir la formu- 
le (3.5.41)). 

Nous allons calculer l'espérance mathématique de la variable 


aléatoire T = 2, "x. 
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Lemme 2. On a l'égalité suivante : 


Vo 
M 2 n4 = MniMwvo (3.5.53) 
appelée généralement identité de Wald). 


Démonstration. Il s’agit de l’espérance mathématique 
de la somme d'un nombre aléatoire de variables n,, "2, ... de 
même distribution. L'égalité (3.5.53) est évidente pour les variables 
M1» M2, - - . indépendantes du nombre v,, car sous la condition v,=—n 

\ 


MCD nl vo = r) = nMn: et en vertu de la formule de l'es- 
k=1 


pérance mathématique totale (voir (1.4.19)) 

vo co 

M2 ma = Mn 2 rP {vo=r}= Mn Mo... 

= n— 
Nous allons utiliser une méthode analogue pour trouver la formu- 
le (3.5.53) dans notre cas, lorsque les variables n,, n°, . .. et le 
nombre w, sont liés à une même suite S,, n = 1, 2, . .., et sont des 
variables indépendantes. On a alors 


M2 nn) =M (lv 1) P (vo&1)+ 
+ M (u+ 2 m1v> 1)P (vo>1)=1{M (m1 vo<1) P (V1) + 
+MOiw>1)P(v0>1)]+ M( 2, m1v0>1) P(v>1)=— 


= Mn: +M (à mlv>1)P (> 1). 


L'événement {v, > 1} est entièrement déterminé par les variables 
M1» Er, et, par conséquent, la variable n., ne dépend pas de cet événe- 
ment (rappelons que les variables aléatoires n,, n2, . . . sont inde- 
pendantes aussi bien les unes des autres que des variables E,, E., . ..), 
en particulier, M (n° | v > 1) = Mn. Ainsi, compte tenu de la 
distribution des probabilités quand v, > 1, on obtient comme pré- 
cédemment 
vo 


M (> miv>1)=M(ne]|vo>1)+ 
Rk=—2 


+M(Dmlw>2)P{vV>21v0>1}= 


k=—3 
vo 


=Mn+M(Dmiv>2) 2 


R=3 
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et par conséquent 


M(Emiw>1)P (> 1)= 


= MP (> 1)+ MZ m1 v0>2) P (v>2). 


En utilisant successivement cette méthode pour. les autres r — 
— 8, 4, ..., on obtient 


MD nelvo>n—1)=Mna + 
hk=n 


P (vo> n) … 
+M( D mv>r) n —3, &, .., 
k=n+1 


et finalement 


M CS ne) =Mni+-MneP {> 1} +... 


+ MP {v>n—1}+...—=Mn 2 P(0>r}=MnMve, 


ce qu'il fallait démontrer. 
L'identité de Wald donne l'expression suivante pour la valeur 
moyenne de la période d’indisponibilité T : 


MT=—., (3.5.54) 


où g = F£ (0) pour x grands est approximativement la probabilité 
pour que la n-ième demande trouve le système disponible (== Mv} 


et b = Mn,, le temps moyen de service d’une demande. 

Notons que la formule (3.5.54) donne la valeur moyenne non 
seulement de la première période d’indisponibilité (à partir de l’ins- 
tant d’arrivée de la première demande) mais également de toute 
période d’indisponibilité en général : 


v1 V2 
Ti= À vw, Ta= À Me -.., 
R—vo+ 1 k=—vitli 
où Vo, Vs, - - - sont les valeurs successives de 7 telles que la 


(n + 1)-ième demande trouve le système disponible. 


Considérons la longueur x (f) de la file d'attente après le temps t 
à partir du commencement du service de la première demande arri- 
vant à un certain instant T;, (plus précisément, x (t) est le nombre de 
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demandes arrivées dans le système et non encore servies). Posons 
P,(D =P {z( =k}, k = 0, 1, 


P, (t) est la probabilité pour que le système soit disponible à l’ins- 
tant t, +- it, P, (t) la probabilité d'une seule demande en cours de 
service dans le système, etc. 

Précédemment nous avons vu que les variables G£,, temps d'at- 
tente du service de la n-ième demande, ont une distribution limite 
pour r—+ oo. Nous allons montrer que, pour £—> oo, la « longueur 
de la file d'attente » zx (ft) a une distribution limite. 

Désignons par 

Va v1 
= T, t=u+ à Ex, T=t+ DT …. 


les instants successifs auxquels les demandes arrivées trouvent le 
système inoccu pé (ici Vs, V1, - . . sont les mêmes valeurs que pré- 
cédemment, voir page 184). Introduisons le processus de renouvelle- 
ment suivant S*, nr — 1, 2, : 


S5 =0, S% = r — 1° SIT, ..., 


0 ? 
LU 

« NT e e Le e 

où S*— >, E* sont les sommes des variables indépendantes posi- 
k=1 


tives de même distribution Et = t? — 1*_:, k = 1, 2, .... En 
vertu de l'identité de Wald, l’espérance mathématique ME: : 
vo 
ME =M D Bi = ME-Mvo = — (3.5.55) 


R=1 


existe (comparer avec (3.5.54)). 

On sait bien que les variables E* (4) = £ — Sie, où v* (£) est le 
nombre de renouvellements dans le temps £{, obéissent au théorème 
du renouvellement selon lequel la distribution de la variable E* (t) 
pour t— oo converge faiblement vers la distribution d'une variable 
certaine E*. 


Théorème 2. Supposons que les probabilités P, (t), k = 0, 1, 
soient des fonctions continues de t *). On a alors les valeurs limites 
P,=lim P;(t), k—0, 1, .... (3.5.96) 

t—00 

Démonstration. Il est évident qu'après chaque instant 
t* auquel la demande arrivée trouve le système inoccupé, le pro- 
cessus de formation de la file d'attente recommence et, par consé- 
quent, la probabilité pour que la file au bout du temps uw et après 


*) Notons que, de façon formelle, la fonction des valeurs discrètes t — 
= 0, 1, 2, ...est toujours continue. 
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l'instant 19 + S* soit égale à À est la mème que pour nr —0, c'est-à- 
dire égale à P, (u). Il s'ensuit que, pour S$+x, = s fixé, la proba- 
bilité de l'événement zx (t) = k sera 


P {x (6) = À | Sec} = Pa (£— See) = Pa (E* (6) 


P, (1) = MP, (E* (4). 


Mais, par hypothèse, les distributions des variables aléatoires E* (4) 
pour {—+ oo convergent faiblement vers la distribution d'une cer- 
taine variable aléatoire E*, et en vertu du théorème 1, $ 5, chapitre 
IIÏ,ona 


et 


Mu (E* (1)) —+ Mu (E*) 


quelle que soit la fonction u (x) limitée continue; pour u (x) = 
= P, (x) on obtient la relation limite (3.5.55) dans laquelle P, = 
= MP, (£*) 


$ 6. Processus aléatoires dans les systèmes linéaires 


1. Remarques préliminaires. Nous dirons qu’un système physi- 
que est linéaire si sous l’action de perturbations extérieures y (s), 
0<s<t, son état de phase à l'instant t (sous les conditions ini- 
tiales nulles) est 


t 
x (t) — | w(t,s)y(s) ds, (3.6.1) 
0 


où w (f, s), 0 s< t, est une certaine fonction continue par mor- 
ceaux ; w (4, s), { > 5, est généralement appelée fonction de pondéra- 
tion. Elle décrit le comportement du système qu’une « impulsion 
unité » Ô (£ — s) fait sortir à l'instant s de son état de repos (à (t) dé- 
signera ici et ci-dessous la « fonction delta »). 

A titre d'exemple de systèmes linéaires on peut citer un système 
décrit par une équation différentielle linéaire 


2 (t)tar 9 (+... Harz(t) = y(#), (3.6.2) 


où les coefficients a; = ax (t), k = 1, ..., n, peuvent varier dans 
le temps {. Dans ce cas la fonction de pondération w (f, s), t >s, 
pour chaque s fixé, est la solution de l'équation homogène 


dn dn-i 
mn W(s)+a-rwi(t,s)+...+anwt(t, s)=0 
aux conditions initiales suivantes : 


 p(t, S)[t=s=0, k—0,1,...,n—2; (4, S) |1=s = 1. 


dn- 
dtà din 
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t 
(On peut vérifier directement que x (f) = | w (ft, s) y(s) ds est la 


0 
solution de l'équation différentielle (3.6.2) satisfaisant aux condi- 
tions initiales nulles 2 (0) — O pour 4 = 0, 1,..., nr —2 et 


z"-D (0) = 1.) 


Considérons le comportement d’un système linéaire à fonction de 
pondération w (£, s) soumis à l’action de perturbations chaotiques 
rapidement variables. 

Nous allons supposer que ce système est soumis à l’action d’im- 
pulsions aléatoires indépendantes du type An (é) Ô (ft — t;) appa- 
raissant aux instants {,, où An (4:), 4 = 1, 2, . .., sont des varia- 
bles aléatoires dont l’espérance mathématique et la variance sont 


M An (4) = a, At, D An (&) = b, At, (3.6.3) 


(Aty = tr — tr désigne l'intervalle de temps antérieur à l’appa- 
rition de l’impulsion suivante). Par suite de cette action, « à la sor- 
tie » de ce système il y a formation d’un processus aléatoire E — 
= Ë (1), 1 > to (to — 0) du type 


E(t)= D w(t,tx) An(t) (3.6.4) 
0<t,<t 
pour lequel 
Mi) D wtt,t:)MAn()=  w(t,tr) alt, 
0<t,< 0<t,<t 
DE()= À w(t,4)DAn(t)= À w°(t,t:)brAtn. 
0<t,<t SE, <t 


Imaginons ce qui va se passer si les intervalles entre différentes 
impulsions sont très petits, plus précisément ce qui se produit pour 
max At, —+ (0. 

Pour souligner la relation entre les coefficients a, et b, de la 
formule (3.6.3) avec l'intervalle de temps correspondant (f:1, tx), 
introduisons les fonctions a (£) et b (t) de la forme a (t) = a,, b (t) = 
= b, pour ty <tLtr, k = 1, 2, .... Supposons que pour 
max At, — 0 ces fonctions soient bornées; pour plus de simplicité, 
on aurait pu supposer dès le début que 


a = € (£x); br (éx), 
où a (t) et b (t) sont des fonctions continues par morceaux. Dans ce 
cas, l’état de notre système à l'instant f£ à la limite, pour max Af, —- 
— 0, sera une certaine variable aléatoire & ({) d'espérance mathé- 
matique 
L 
ME (= lim D'w(e, ta) a (#x) Ata= | w(e, s) a (s) ds 


0 
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et de variance 


[4 
DE (1) = lim D w2(1, 4a) b(tx) Ata= À a? (4, s)b (s) ds. 
0 


Les hypothèses faites précédemment permettent de conclure que 
les variables An (£;) sont des infiniment petits pour max Af, —+ O, 
plus précisément on a 


M [An (4) = b (1) At, + la (t,) At —+ 0 
et avec cela 


S' DAn(a)= D b (x) Ati + | b(s) ds. 


O<t,<! 0 


Si l’on suppose de plus que [An ({,)/° sont en un certain sens des 
infiniment petits d'ordre plus élevé ou, plus exactement, que la 
condition 


> MiAnt&)[—0 (3.6.5) 
0<t,<t 


est vérifiée, en vertu du théorème de la limite centrée on peut affir- 
mer qu’à la limite (pour max At; —+ 0) la variable E (£) aura une 
distribution gaussienne : 
; 2 (x A)? 
PE DET) = le 2B dr, (3.6.6) 


+’ 


où 
t t 
A=— | w(t,s)a(s)ds, B— | w® (4, s)b(s) ds. 
0 0 
En effet, il est facile de voir que pour des sommes de composantes 
indépendantes E (£) = à v (£, tx) An (#&:) sera vérifiée la condi- 


SR 


tion de Liapounov : 
, M [uw (é, tn) M (tx) —Muw (é, lu) An (4x) P< 
< max [w(£, s)[° DM|An(tx)— a (4) Atx F0 
<s<t 


(rappelons ici que ME ({) + À, DE (1) — B). 
Pour décrire l’action externe 


nft)= Y An(:)6(—4), (3.6.7) 
0<t,<t 


13-0521 


194 MODÈLES DE PROCESSUS ALÉATOIRES [CH. III 


il est commode de faire appel au processus aléatoire suivant : 
{ 


n@= fntsds= S Ant), 6.6.8) 
0 0<t,<t 


caractérisant grossièrement l’action totale subie par le système dans 
l'intervalle £. Partant du processus aléatoire n (4), { > 0, on pour- 
rait noter les variables An (4) comme suit: 


An (tx) = n (x) — n (tri), k = 1, 2, ... 


en prenant pour n ({£), t > 0, un processus à accroissements indé- 
pendants tel que les accroissements An (f;) = n (fx) — n (t:1). 
k = 1,2, ..., soient des variables aléatoires indépendantes (quels 
que soient bb < {4 L'le L ...). À titre d'exemple, citons le mou- 
vement brownien et le processus de Poisson bien connus qui jouis- 
sent de cette propriété. 

Pour max Af, —> 0, on a en fait affaire à une action continue de 
perturbations infiniment petites et indépendantes que subit le sys- 
teme, et il est tout naturel dans une telle situation de passer du 
modèle « discret» (3.6.4) à un modèle « continu » que représente 
par exemple l’intégrale stochastique 


t 


10 | w (t, s)dn (s). (3.6.9) 


0 


2. Intégrale stochastique. Le processus aléatoire n = n ({) est 
appelé processus à accroissements non corrélés si, pour tous  < 4 
< S2  t2, les variables n = n (4) — n () et ne = 1 (f:) — n (s2) 
sont non corrélées : 


M (m1 — Mni) (ne — Mn) = 0. 


A ce type de processus se rapporte évidemment tout processus à 
accroissements indépendants (d’espérances mathématiques et de 
variances finies), en particulier, le mouvement brownien et le pro- 
cessus de Poisson. 

Nous aurons à considérer ultérieurement (voir $ 7) des processus 
aléatoires complexes. 

Notons que pour la variable complexe n la variance se définit 
comme suit : 


Dn = M |n — Mn , 


les variables aléatoires n, et n. prenant des valeurs complexes sont 
dites non corrélées si 


M [n: — Mn] In: — Mn, — 0. (3.6.10) 


$ 6] PROCESSUS ALÉATOIRES DANS LES SYSTÈMES LINÉAIRES 195 


Ainsi, un processus aléatoire complexe n (£) est appelé processus à 
accroissements non corrélés si. quels que soient les accroissements 
mM=Nn()—-n(s), ne =n(G)—nt(s), où s Lt LS Lt la 
condition (3.6.10) se trouve vérifiée. 


Considérons le processus aléatoire n (£), c, < t < c2, à accroisse- 
ments non corrélés tel que 


Mint@—n()= (atu)du, Din@—n(@1=\btudu (36.11) 


(la fonction non négative b(t),  Lt<L c:, en vertu de (3.6.11) 
sera appelée densité structurale du processus aléatoire n (£)). 

Considérons tout d’abord le cas où a (4) = 0. 

Pour toute fonction constante par morceaux ® (ft), «<< C, 
conservant les valeurs constantes y, = q (f) pour té, <t<t, (où 
les points ©, = fo, ty, . . ., fn = C2 divisent le segment {c;, c.] en 
un nombre fini d’intervalles), l'intégrale stochastique est définie par 
la formule 

Ca n 
| PUan(= 5 an(s), (8-6.12) 


C! RkR=t 
en posant An (fx) = n (tx) — 1 (fn), À = 1, ..., n. Il est clair 
que la variable | y (£) dn (f) ne dépend pas du mode de partition 
du segment en « intervalles de constance » (£:-1, tn), k = 1, ..., n. 


Donc, pour toutes fonctions constantes par morceaux œ (4). 1 (t) 
et les constantes À,, À. on a 


À ap (+ Ab lan (= M | pan +2 | van. (8.613 


Il est aisé de vérifier que 
M ( v@)ants)=0 
cf 


et, comme il résulte de la condition (3.6.10), on a 


c ce 


Mfoomefvoamb]-frorweuwa (6.619 


Ci C1 


(la manière la plus simple de vérifier (3.6.13) et (3.6.14) est d’em- 
ployer une partition commune à œ et w, à savoir ©, = fo, ty, .. 
. ln — Ce). 


13° 
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En particulier, 
ce 


M feomef-|feonef=fieursoæ, 6615 
C1 C1! C1! 
et pour la distance moyenne quadratique entre les variables 
E=— ETET et n= ÉTET 
C1 Ci 
on obtient l'expression suivante : 


ln = [love ( a. (3.6.16) 


« 


Soit p(t), «uLt<Lc, une fonction satisfaisant à la condition 
| [p(H)Fb(E) dt <o, (3.6.17) 
C1 


telle que l’on puisse trouver une suite de fonctions , ({), n — 
= 1, 2, ..., constantes par morceaux convergeant en moyenne 
quadratique vers œ (4): 


| |Pn (t)—p(t)lb(t)dt +0 pour nr —+ 00 (3.6.18) 
c1 


Ce 
(on a de plus | 1x (t)— Pnm(#)Pbh(t)dt 0 pour n, m— 00 ) . La 


ci 
suite correspondante d'intégrales stochastiques 
Ca 
En = | n (#) an (9) n=1,2, ..., 
C1 
satisfera ainsi à la condition suivante: 


I En — Em | = | | Pn () — Pm(t)b(t)dt 0 pour nr, m— 00, 


C1 


et par conséquent, il existe une variable E qui est la limite de cette 
suite (voir le théorème 2, $ 4, chapitre I): 


Ï En — ë [| —> 0 pour 7 —> oo. 
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c2 


Nous désignerons cette limite E — | p (£) dn (t) et l’appellerons 


. C1 
intégrale stochastique *) (de la fonction œ (4)). Il est clair qu'avec la 
probabilité 1 la variable E est déterminée d’une manière univoque et 
ne dépend pas du choix de la suite , (4), nr = 1, 2, ..., conver- 
geant vers (4). 

Il est aisé de voir que pour l'intégrale stochastique que nous 
avons définie, les relations (3.6.13)-(3.6.16), dont il a été déjà ques- 
tion dans le cas des fonctions constantes par morceaux  (é) et 
+ (£), se trouvent vérifiées du fait qu'elles restent vraies lors du 
passage à la limite des fonctions constantes par morceaux aux fonc- 
tions du type général satisfaisant à la condition (3.6.17). 

Il y a lieu de noter que pour des fonctions continues par morceaux 


Can n 


ET dn (= lim m.q. D Pan) An(tan),  (8.6.19) 


ct k=1! 


où dans le second membre on prend les « sommes intégrales » pour 
des intervalles de partition de plus en plus petits, c'est-à-dire en 
divisant le segment [c1, c.] par les points 4,,, k — 1, ..., n, de plus 
en plus nombreux, ce qui correspond à la définition générale donnée 
ci-dessus de l'intégrale stochastique lors du choix de la suite de 
fonctions constantes par morceaux ®, (£), nr — 1, 2, ... du type 


Pn (#) — P (ln), lruton LE Len; k — 1, A n. 


Etendons la définition de l'intégrale stochastique à un inter- 
valle infini [c;, cel. 

Pour toute fonction œ (f), c, < t < c:, satisfaisant à la condition 
(5.6.17), quelles que soient la suite à décroissance monotone c, — «à 
et la suite à croissance monotone c., — c:, n —= 1, 2, ..., pour n, 
m —+ oo, On à 


C2n Com 
( ] e 


| | p (£) dn (4) -— | @ (£) dn (4) | = 
= Tiompowas |ipwprowa-0 


*) 11 y a licu de noter que la « différentielle » dn (t) ne doit pas être com- 
prise dans le même sens que pour les fonctiuns dérivables ordinaires (pour 
lesquelles d1 (t) — n° (t) dt), car l'accroissement An (t) — n (t + At) — n (4) 
est en moyenne de l’ordre de V/At (et non de At comme il le serait pour une 
fonction dérivable 1 ({)); on a ainsi 


MIAn()l®=b()Ar et IMOT., co pour At 0. 
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(où l’on suppose que nr > m), il en résulte l'existence de la limite 


cn 


lim m.q. | p (£) dn (t) = i p(t)dn(t). (3.6.20) 


Cin—Ci, C2n—Ce 
in 1, C2n Cin ci 


Considérons maintenant la notion d'’intégrale stochastique dans 
le cas d’un processus à accroissements non corrélés n (ft), <t< ca, 
d’espérance mathématique non nulle: 

{ 
Mn (#) = | a (u) du. 


C1 


Pour toute fonction q (£), co < { < C2, satisfaisant à la condition 


fipOa@ldt<o, |[|p(t)Pb(Hdt<o, . (36.21) 
c{ ci 
posons 


ouate Temanta+ lea, (6629 


n°0 =n0—-Mt, a <t<ec, 


est un processus aléatoire à accroissements non corrélés du type étu- 
dié précédemment (d'espérance mathématique nulle) et de densité 
structurale b (), a <t< ca. 

Les formules essentielles pour les intégrales stochastiques défi- 
nies ci-dessus se modifient évidemment comme suit: au lieu de 
(3.6.14) on a: 


ME] p (#) dn (#) | = jewawa 


M [| p (é) dn (e)- [ Ÿ (t)dn (9 | == [ q (é) (4) b (8) dé +  (3.6.23) 
+ l'etat ar. fsoeua Y(t)a(é) dt; 


et au lieu de (3.6.15) 


M fooanol= {euro fonewal. 6620 
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Tout comme précédemment, si la suite de fonctions , (t), r = 
c2 


— 1, 2, ..., est telle que | | m, (t) — p(t) Fb(t)— 0, et si de 
ci 


plus 
( Pa (é) a (t) dt —+ | p(t)a(t) dt, 


on aura 
9 (e) dn (#)= lim m.q- À n (9) dn (9 (3.6.25) 


C1 


dans le sens de la convergence en moyenne quadratique; en parti- 
culier, pour une fonction œ ({) continue par morceaux l'intégrale 
c2 


stochastique | p (ft) dn (#) est la limite des « sommes intégrales » du 


type (3.6.19).' 


3. Convergence vers un processus stationnaire. Considérons un 
système linéaire dont la fonction de pondération 


wi, ss =w(t—s), t>s, (3.6.26) 
dépend seulement de la différence { — s (la fonction w (t), t > 0, 


est également appelée fonction de pondération). Nous dirons qu’un 
système linéaire est stable si les conditions 


| lw()ldt< ce, À lo (2 dt < 00 (3.6.27) 
0 0 


sont vérifiées. 
Supposons que le système est soumis à l’action d’une perturba- 


tion extérieure n (t) telle que le processus aléatoire & ({) à la sortie 

du système puisse s’écrire sous la forme d’une intégrale stochastique 
t 

E(= [w(t—s) an(s). (3.6.28) 


0 


où le processus aléatoire n ({) à accroissements non corrélés (caracté- 
risant l’action extérieure intégrale— voir (3.6.8)) est homogène en 
ce sens que les fonctions a (t) et b (t) dans les relations (3.6.11) sont 
des constantes, soit : 


af=a, b(t) = b. (3.6.29) 
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Considérons un processus aléatoire 
E° (2) = w(t—s)dn(s), to<St< oo, 
commençant à l'instant t, et le processus limite 
t 
E* (4) — | w(t—s)dn(s) — Jim w(i—s)dn(s), —co<t<o, 


— œ lo 
(3.6.30) 


(commencé dans un passé infiniment éloigné). En utilisant les for- 
mules (3.6.23), (3.6.24) on obtient 


IE (€) —£* (2) =] w (£—s) dn(s) | = 


-s | uw (t—s) Fds+|a ( w(t—s) ds| = 


— b [12 (9 Pds+|a [a (9 ds|". 
t 


On voit que 
I E (4) — E* (4) || — 0 pour { —+ oc. (3.6.31) 


Posant w (£) = O pour £ << 0, le processus aléatoire £* ({) peut 
s'écrire comme suit : 


E® (1) — | w (£— s) dn (s). (3.6.32) 


La valeur moyenne de ce processus est constante, c'est-à-dire 


O0 


A(t)= ME" (4) = a | w (u) du, (3.6.33) 
tandis que la fonction de corrélation : 
B(t, s)= ME" (t)E* (s) =b | w(t—u)w(s— u) du = 
— b | w(i—s—u)w(u) du = B(t—s) (3.6.34) 


dépend seulement de la différence { — s. Le processus du type E* (4) 


est dit stationnaire (au sens large). 
Nous avons obtenu le résultat suivant. 
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Théorème. Un processus aléatoire & (t) à la sortie d’un système 
stable admettant la représentation par une intégrale stochastique 
(3.6.28), pour t — œ, converge en moyenne quadratique vers le pro- 
cessus stationnaire E* (t) défini par la formule (3.6.30). 


Il convient de noter le fait suivant. 

Supposons que le processus aléatoire n (i) soit un processus homo- 
gène à accroissements indépendants, c'est-à-dire que les distributions 
des accroissements 1 ({) — n (s) soient les mêmes pour tous les 
intervalles (s, t) de même longueur # — s, les variables n (?,) — 
—n(s:), 4 = 1, 2, ..., n, pour tous les 5 <<... Lsn L 
< t, étant indépendantes les unes des autres. 


Il est alors facile de comprendre que le processus E* (4) — 


00 


— | w (t — s) dn (s) sera également stationnaire en ce sens que la 


distribution simultanée des valeurs E (4, + s), ..., E (4, + s), 
quels que soient £,, . .., {, fixés, est la même pour tous les s. En 
particulier, pour tous les £ la distribution de différentes valeurs de 
E* (4) est la même que celle de la variable 


E* — | w(—u)dn(u). (3.6.35) 


—œO 


Par suite de Ia convergence en moyenne quadratique de 
IL E () — E* (4) |] — 0 (voir théorème 2, $ 5, chapitre I), la distri- 
bution des variables E ({) pour { — oo converge faiblement vers la 
distribution de la variable £* définie par la formule (3.6.35). 


4. Effet de grenaille. Considérons le système linéaire (3.6.1) et 
supposons qu'il soit soumis à l’action d’impulsions aléatoires 


nxÔ (£ — Tz), À = 1,2, ..., apparaissant à des instants aléatoires 
Th, & = 4, 2, ... . Cette action est un processus aléatoire du type 
n(= D mô(—T), OEIL; (3.6.36) 

Ty 


l’état du système E (4) changera dans le temps £{ comme suit: 


Et—= Ù O muw(t—wu), 0<t<oo (3.6.37) 


OT, < 


(comparer (3.6.4), (3.6.7)). Le processus aléatoire & = Ë (it) de ce 

type est généralement appelé processus d'effet de grenaille. 
Supposons que les impulsions aléatoires n; Ô (£ — T;) apparais- 

sent suivant une loi de Poisson de paramètre À, c'est-à-dire que dans 
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l'intervalle de temps (s, £) avec la probabilité 


[A (— s)}" e—à (t-s) 
n! 


on aura exactement nr impulsions (indépendamment du nombre d’im- 
pulsions en dehors de l'intervalle donné entre s et t). Supposons que 
les variables aléatoires n:, À = 1, 2, . . ., caractérisant la directivité 
et l'intensité du flux d’impulsions, aient même distribution, tout 
en étant indépendantes tant les unes des autres que des instants —;, 
k = 1,2, .... 

Pour caractériser l’action extérieure du type mentionné nous 
allons faire appel au processus aléatoire suivant : 


t v(t) 
n (t) — | n(s)ds= Dm, 0LI<oo, (3.6.38) 
0 k=1 
où v(éi), O0 << oo, est un processus de Poisson ordinaire, et 
Mis Mr, - - . la suite correspondante de variables aléatoires indé- 
pendantes de même distribution, ne dépendant pas non plus de 
-vV (4), 0 LL oo. Un tel processus aléatoire n = n (f) est appelé 
processus de Poisson complexe. 


Montrons que si les variables correspondantes n, ont une espé- 
rance mathématique 


a = Mn, 
et un moment deux fini 
b = Mn;, 


les relations (3.6.11) se trouveront vérifiées, de plus 
a (t) = akt, b(t) = bAt (3.6.39) 


(où À est le paramètre du processus poissonnien correspondant v (é)). 

En effet, si l’on désigne par wv (s, t) le nombre d’instants t; dans 
‘intervalle [{s, £}, pour v(s, t) — nr donné la variable n = n (t) — 
— n (s) est la somme de #7 composantes indépendantes n, de valeur 
moyenne a et de variance 6° = b — a*. Par conséquent, 


Mfnlvt(s, ?)) = avis, t), 
et en vertu de la formule de l'espérance mathématique totale, on a 
Mn =M{Mniv(s t#))} = aMvs, t) = aù (t — ss). 
Puis 
Mn lvts, ?)) = ov(s, ?) + (av (s, t))?, 
Mn = M{Mnlvts, t))} = o7à (4 — s) + a°M [v (s, t)F 
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et 
Dn = Mn — (Mn) = ofA (£ — s) + a* [Mv* (s, 1) — 
— (Mv (s, 1))?] = où (t — s) + a Dv (s, t) = o°À (t — s) + 
+ a (t— 5) — bÀ (t —s). 


Considérons l'intégrale stochastique [ p (£) dn (t), où n (té) est 


C1 
un processus de Poisson complexe du type décrit ci-dessus. 
Nous allons montrer que pour toute fonction continue par mor- 
ceaux  (£), a Lt C2, avec la probabilité 1 on a 


j pHdnt= > pain (3.6.40) 
C1ST}<e2 


(rappelons que l'intégrale stochastique Ë = | p(t)dn (t) en tant 


° C1 
que limite en moyenne quadratique d’une suite de variables aléa- 


an 
> 


toires E, — | Pr (t) dn(t), n — 1, 2, ..., est définie seulement 


C1 
avec la probabilité 1, à savoir toute variable différente de & avec la 
probabilité 0 est également la limite de cette même suite E,, nr — 
= 1,2, ...). 
Pour une fonction œ (t), 4 St <c+, continue par morceaux 
conservant les valeurs y, =  (f) constantes pour £, << { < ty}1, où 


les points to — Cy, . -., ln — © partagent le segment [c:, c.] en un 
nombre fini d’ intervalles, la probabilité de coïncidence des instants 
aléatoires t; avec les points f,, k = 0, ., AR — 1, est égale à 
zéro et avec la probabilité 1 on a 
n—1 
1. 
DO Oœppm= DT À  p(ranil= 
CIST;<C2 k=0 a LT let 
n— { n—i en 
=Y Eu, x m]=Z nims)-n(@)e | e(@an(e. 
k=_0 <Tÿ< <tyyt k=—0 C1 


Pour une fonction œp (f) continue par morceaux, limite d’une cer- 
taine suite de fonctions continues par morceaux ®, (4), nr — 1, 2,.. 
la formule (3.6.40) s’obtient par le passage à la limite 


ce c? 


fotbant= > pm (pan. 


ci CtSTyT C2 c1 


°9? 


204 MODELES DE PROCESSUS ALÉATOIRES {[CH. LIL 


d'autre part, en posant 
An(t)=qn(t)—pli) et en max |A (t)|, 


ES Ed 
on a 
US qu tn; - 
C1STj<C2 CAS TK C2 
EME EL htnfeeMl Sim <cer-0, 
C1<T<C2 TE < co 
où 


C=MI D In (Min + (Min DA (ca — 0). 
C1Z 


j=<2 


La formule (3.6.40) que nous avons obtenue permet de donner 
une représentation concrète de l’effet de grenaille exprimé par (3.6.37) 
par une intégrale stochastique du type (3.6.8), soit : 


E (4) = | ete s) dn(s). (3.6.41) 


En particulier, si la fonction de pondération w ({, s) = w (t — s) 
satisfait aux conditions (3.6.27). on peut appliquer à l'effet de gre- 
naille & (£) le théorème de convergence vers un processus stationnaire 
(voir page 20{), ainsi que son supplément, car le processus de Pois- 
son complexe n (t), é > 0 dans (3.6.41) est un processus homogène à 
accroissements indépendants. 

Nous allons rechercher la probabilité avec laquelle le: système 
après le temps { se trouvera dans tel ou tel état de phase ou, plus 
précisément, la distribution de la variable aléatoire E& (4). 

Il est manifeste que cette distribution dépend de la distribution 
des variables aléatoires n,. 4 — 1, 2, ..., à l'entrée du système. 
Soit £g (u) la fonction caractéristique des variables n, de même dis- 
tribution; recherchons la fonction caractéristique f; (u) — Meït“tt), 
— 00 Tu << ©, de la variable E (£) qui nous intéresse. 

Désignons par v (f) le nombre d’impulsions dans l'intervalle #. 
Rappelons (voir chapitre IT, $ 2) que pour v (t) = n fixé les instants 
Ty + + + Tn d'arrivée des impulsions sont répartis sur le segment 
[0, :] tout comme si les points %, ..., t, étaient distribués au 
hasard, indépendamment les uns des autres, suivant une loi unifor- 
me, de telle sorte que pour v (f) = n fixé la variable E (£) est la 
somme de r composantes indépendantes et de même loi n;w (£, t:), 
k —1,..., nr (t, sont uniformément répartis sur le segment [0, 1] 
et n: sont indépendants de v (#) et de T,, Tt:, . . .). Par conséquent, 


» . À à {, 
pour T7, = s donné la valeur moyenne de la variable e“"(*""4 sera 


Mein mu = g (uw (t, s)), 
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et pour v(t)=n fixe 
ME uv (D =n}= M {g lu (t, w)]| v(#) =n} 


t 
1 
= | élus, s)1 ds 
( 


et 
{ 
M {eiuEt® | v(#) = n} = [+ | g (uw (t, s)) ds |”. 


0 
En vertu de la formule de l'espérance mathématique totale on a 


Meiui(t) — > Mein |v(t)=n}P{v({)=n}= 
n—0 
t 
00 ; { Un au a À g(uwi(t, s)) ds 
= ÿ | + | g (uw (1, s)) ds | re M=e x Le © 
n 0 0 


Finalement, on obtient la formule suivante pour la fonction carac- 
téristique fr (u) = Meïivëtt) : 


t 
fi (u) — exp {2 | [g (uw (t, s)) —1) ds } , —00<u<<co,(3.6.42) 
0 


où g(u) = Me"%* est la fonction caractéristique des variables 1}, 
k — 1,2, ...,et À le paramètre de la loi poissonnienne correspon- 
dante. 

En particulier, pour w (t) = 1, 0 < { << co, lorsque c’est le cas 
d’un processus de Poisson complexe E (t) = n (t) (voir (3.6.38)), la 
fonction caractéristique est 


fe (u) = eMTEUM)—11,  — 00 Lu < 00 (3.6.43) 


(pour un processus de Poisson ordinaire n, = 1 et g(u) = e“"). 

Remarquons en définitive que pour un système linéaire stable 
de fonction de pondération w (t), lorsque le processus aléatoire E (4) 
pour {—> oo converge en moyenne quadratique vers un processus 
stationnaire (voir (3.6.31)), la distribution de la variable E ({) con- 
verge faiblement vers la distribution de la variable E* définie par la 
formule (3.6.35), par conséquent, les fonctions caractéristiques des 
variables £ (4) valant en vertu de (3.6.42) 


t 
fe(u)=exp {à | [g (uw (s)) — 11 ds }, — 00 LUZ 00, 
0 
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convergent pour £—> vers la fonction caractéristique 

f (u) —exp {à | Lg (uw (s)) — 1] ds }, — 00 Lu 00, 
de la variable E*. 


$ 7. Processus aléatoires stationnaires 


1. Représentation spectrale des processus stationnaires et trans- 
formation de Fourier. Rappelons qu'un processus aléatoire E — 
= E (£), — oo << t< 00, est dit stationnaire au sens large si la 
valeur moyenne À (t) = ME (f) reste la même pour tous les t£ et la 
fonction de corrélation B (f, s) = ME (ft) & (s) ne dépend que de la 
différence { — s. Dans la suite nous supposerons À (t) = 0. 

Nous allons étendre la notion de stationnarité aux processus 
stationnaires à valeurs complexes EË (t), M E (1), = 0, de la maniere 
Suivante: un processus aléatoire Ë (£), — oo << {<< 00, est dit s{a- 
tionnaire au sens large si ME (t) E (s) ne dépend que de la différence 
L—S: 


ME(GE(S) = B(t—5); (3.7.1) 


la fonction B (f)}, — o << t < co, est appelée fonction de corréla- 
tion du processus stationnaire E (£). 


Exemple (processus stationnaire à spectre discret). Considé- 
rons un processus stationnaire de la forme 


Us  iAnt ._ 
EU= Deus —o<t<oe, (3.7.2) 
OÙ À-_n, + - «> ÀÂn Sont des nombres réels et D,, ..., ®, des va- 


riables aléatoires non corrélées de valeurs moyennes nulles : 
M®,O, =0 pour k Æj. 
Il est évident que 
ñn 
ME(G)= À e°x° MOD: = 0 
k 


= nn 


et 
n n n 
MEG)E(S)= À D et MED, = N ex 9 p,, (3.7.3) 
hk=-n J=-n h=-n 
où F, =M]OD, ,k — —n,...,n, il en résulte que le processus 


aléatoire E (£f) est stationnaire. 

Ce processus donne un exemple d’oscillations aléatoires dont les 
composantes sont des oscillations harmoniques E; (f) = ekiD, 
de fréquences o@, = | À |, k = —n, ..., n, dont'la phase et l’am- 
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plitude sont des variables äléatoires. Si l’on convient d'appeler la 
valeur moyenne quadratique M |E (4) énergie moyenne du pro- 
cessus stationnaire E ({), alors à partir de l'égalité (3.7.3) pour s = t 
on a 


MIE (1) F= à Fi 


où Fr = MID, F =M ]E,(t) |, et on voit que l'énergie du pro- 
cessus stationnaire E (t) est la somme des énergies de différentes com- 
posantes Ez (4) = en", k = —n, ...,n. 

Les valeurs À,, & — —n, ..., n, sont généralement appelées 
fréquences (mème si À, sont négatifs) ; ces valeurs forment dans leur 
ensemble le spectre de fréquence du processus stationnaire Ë (4). 


Exemple (processus stationnaire à spectre continu). Considé- 
rons un processus aléatoire E (£) admettant la représentation spec- 
trale : 


EG= | ent (x), (3.7.4) 


*“ 


où D (À), — oo << À << oo, est un processus aléatoire à accroisse- 
ments non corrélés et de valeur moyenne nulle, tel que pour tout 


intervalle (À,, À) on ait 
À2 


MIOGA)—DQ)F= (A; - (3.7.5) 
À 
la densité structurale f (À) de ce processus est supposée intégrable. 
Dans la formule (3.7.4) on a une intégrale stochastique de la 
fonction complexe œ (À) = et, — oo << À << 00. 


Rappelons que l'intégrale stochastique | (À) dO (À) que nous 


— © 
avons définie dans le $ 6 est douée des propriétés suivantes : 


M | œ (à) dD (à) = 0, 


M ETC do QE [ 1o0) ff (4) 4», (3.7.6) 
et dans le cas général _ 
m| j p@)4® (G)][ Ï v (A) dD (1) ] = [ p PAC A, (3.7.7) 
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où la fonction f (4) > 0 est la densité structurale du processus © (À) 
figurant dans la relation (3.7.5). 

Considérons donc le processus aléatoire Ë (£) défini par l'égalité 
(3.7.4). Pour q (À) = et, 1 (À) = es on obtient à partir des for- 
mules (3.7.6) et (3.7.7) 


ME( —=0 
et 
ME (4) Es) — | ein (Es) f (1) dA. 


On voit que E (£) est un processus stationnaire de fonction de 
corrélation 


B(t)= | eitf (À) dà, (3.7.8) 


coincidant avec la transformée de Fourier de la densité structurale 
f (À) du processus ® (À) ; f (À) est également appelée densité spectrale 
du processus aléatoire Ë (t). La densité spectrale f (À) est à son tour 
déterminée d’une manière univoque par sa transformée de Fourier 
B (t) et en particulier, lorsque la fonction de corrélation B (t),—o0< 
<< t << ow, est intégrable, on a 


fO)= + | e-i1B(t) dt. (3.7.9) 


—œ 


La formule (3.7.4) donne le développement du processus aléatoi- 
re E (t{) en oscillations harmoniques élémentaires, plus précisé- 
ment, . ‘ 


E (4) = | et dD (À) — Ÿ ent D, 
—00 RkR=-n 

où D, = ® (A+) — DO (A4), À = —n, ..., n, le signe d’équiva- 
lence « — » désignant que pour une partition de la bande de fréquen- 
ces — An<A<A, en intervalles A;=(Ay, Ans), k= —n,...,n, 
de plus en plus petits, on a 

Et@)=limm.qg à eno®, (3.7.10) 

n—00 h=-n 


(pour max |A; —Arx|—0, An — 00). 
k 


Notons que pour une bande de fréquences quelconque À << 
< À, le processus aléatoire stationnaire 
22 
Ea (4) = | eit dO (À) (3.7.11) 
À 
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pour un intervalle petit À = (4,, À.) représente approximativement 
une oscillation harmonique de fréquence À, À, < À < À, (ceci d’au- 
tant plus précisément dans l'intervalle de temps fixé 4 <t<t; 
que À est petit), et son énergie moyenne est 
22 
Mist) | FA) da. (3.712) 


1 
L'énergie totale du processus stationnaire E ({) est donc 


MEGOF= | @a, 


ainsi, comme on peut le voir à partir de la formule (3.7.12), la den- 
sité spectrale f (À) caractérise la distribution de l'énergie du proces- 


sus envisagé & ({) = { et dO (À) par composantes du type &, (ft) = 


2.2 
— | et dO (À) suivant l'intervalle À = (À, À:) des fréquences 


2.1 
À qui font partie du spectre de fréquences de la composante corres- 
pondante E, (£). 


Considérons un processus aléatoire stationnaire du type 
t 
E (4) = | w(é—s) dn (s), (3.7.13) 
s'établissant dans le temps à la sortie d'un système linéaire stable 
de fonction de pondération w (t) sous l’action de perturbations aléa- 
toires homogènes’n(t) (voir le théorème du $ 6). 
Rappelons que nous avons pu obtenir un processus stationnaire 
du type (3.7.13) moyennant le passage à la limite suivant: 
t 
E(t)= lim m.q. | w (t—s) dn(s), 
to——00 


to 


en reportant l'instant initial {, du fonctionnement du système envi- 
sagé à un passé infiniment lointain. Quels que soient {, < s < t, les 
accroissements 

t 


n()—n(s= | nu) du 
8 
caractérisant l’action extérieure totale subie par le système dans 
l'intervalle de temps entre s et t ne dépendent pas du choix de l’ori- 
14—0521 
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gine {,. Bien que pour Lo ——00 les valeurs n (£) perdent leur sens, 
en fait nous n’avons affaire qu'aux variables An = n (f) — n (s) 
définies pour tout intervalle À = (s, t] tel que sa décomposition en 


intervalles disjoints A, — (s4, 1,1, k = 1, ...,n (A = U A) 
k=:1 


conduise à l'égalité 


Pour concrétiser nos idées nous parlerons du processus aléatoire 
homogène n (f) à accroissements non corrélés An = n ({) — n (s) 
également dans le cas où {, = — en supposant que 


MAn = 0, MIE PF = o° (4 — s), | 


3.7.14 
M (4in- An) = 0 G-7.14) 
pour des intervalles disjoints quelconques A;, À, ; l'homogéneéité du 
processus n ({) mentionnée signifie que sa densité structurale est 
une constante (dans notre cas cette constante est désignée par 0°). 


Considérons maintenant le processus aléatoire Y (À) défini pour 
tous les À > À, comme suit: 


n e it —ilo 
Fo) => Î EE (£). 


—œo 


Pour À, < À LÀ. quelconques les accroissements AY = Y (4.) — 
— Y (A) sur l'intervalle A = (À, À.1 admettant la représentation 


oo 


Po —1hot —ihtt 
| —— — dn(b) (3.7.15) 
possèdent les propriétés suivantes : 

MAY = 0, MIAY [= (Ar — M); | 


M (A1Y-A3Ÿ) = 0 


(3.7.16) 


pour des intervalles disjoints A,, A. Les deux dernières égalités qui 
sont à démontrer s’obtiennent facilement à partir de l'égalité de 
Parseval; à savoir, la fonction sous l'intégrale 


À e— tot e” iAst 


es ——; 


| | ea (4) dt 00, 
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est une transformée de Fourier du type 

ea(t)= —— | e—iM ya (À) dÀ, (3.7.17) 
où #1 (À) est l'indicateur de l'intervalle À = (À, À] (xa (À) = 1 
pour ÀE A et #44 (À) = 0 pour À 4 A) et 


MIAYE= 0 | les (Pd=S | Ita G)Pdh= 7 (eu), 


MATRA) ot | en ()es (dt 7 | a: (A) Las (A) dh = 0 
pour des intervalles disjoints quelconques A1, A. 

La formule (3.7.15) montre que les accroissements AY = Y (4.)— 
— Y (À) sont les mêmes quelle que soit la valeur initiale À,. C’est 
pourquoi pour les fonctions œ (À) satisfaisant à la condition 


| | p (À) F d'A << 00 


> 


on a l'intégrale stochastique suivante: 
| p(A)dY(À)= lim m.q. | p (À) dY (À). 
A0 — — co 
ko 


—œo 


Nous allons envisager, tout comme nous l'avons fait au cas du pro- 
cessus n ({), — co << 1 << oo, un processus aléatoire Y (À), — oo << 
<< À << ©, à accroissements non corrélés, de valeur moyenne nulle 
et de densité structurale g (À) = o“/2x constante, bien que seuls les 
« accroissements » AY = W (À,) — W (A1), définis par la formule 
(3.7.15) pour un intervalle quelconque À = (À, À.), aient un sens 
réel (on appelle habituellement ce processus aléatoire généralisé 
Y (À) transformation de Fourier du processus aléatoire n (t)). 


Passons aux intégrales stochastiques Î p (À) dY (À). 


Pour une fonction constante par morceaux du type œ (À) = 
= à YnXa, (A), où An = (li, 5), & = 1, ..., n, sont des inter- 
k= 


valles disjoints de longueur finie, et sa transformée de Fourier 


Le =) 


ct) = | ei p (à) dà, (3.7.18) 


— 00 


14% 
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on à 
| PGA G= | chant, (3.7.19) 


ce qui est une conséquence simple des formules (3.7.15), (3.7.17), à 
savoir 


ET dY =S yrART = l [s pee, «) | dn (t) = f c (£) dn (1). 
— 0 R=1 —o RÀk=1 —o 


La distance moyenne quadratique entre les intégrales stochastiques 


du type | (A) dY (À) est 


M| { œ (À) dY (à) — f Pe (À) wal=S | | qu (À) — pe (À) Fd2.. 


Semblablement 


Ml [ C4 (t) dn (£) — ( Ce(t) an @[=0 | Leu (#) — ce (t) l° dt. 


— 0 oo 


Rappelons que pour les fonctions c (£), | [ce (t) dt < ©, qui 


sont des transformées de Fourier du type (3.718) des fonctions abso- 
lument intégrables œ (À), en vertu de l'égalité de Parseval on a 


ficfFa=s (lo@Fd; 


À [ie G—es rare À 1e (es (0 Par 
et _ _ 
M| [ qu (à) d'Y (A) — [ Pe (À) dY @ [= 


— 00 
co 


=M| CETTE | ca (#) an (| . 
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où c, (£) et c, (t) sont des transformées de Fourier du type (3.7.18) 
des fonctions ®, (À) et p, (À). 
I1 est clair que si la fonction œ (4) est la limite en moyenne qua- 
dratique d’une suite de fonctions constantes par morceaux , (À), 
— 4, 2, ..., sa transformée de Fourier c (t) est identique à la 
limite en moyenne quadratique de la suite c, (t), nr = 1, 2, ..., 
correspondante, de plus 


oc +00 
| PO)dY G)= im m.q. | qn À) 47 (4), 
Î c(t)dn (@)= lim m.q. | Cn (t) dn (t). 


Mais pour des fonctions constantes par morceaux @, (4) on a l'éga- 
lité (3.7.19), soit : 


Fo ara= [tant n=1, 2, 


par conséquent 


| PQ)SF (A)=lim m.q. Î Pn (à) dE (À) = 
= lim m4. À en (9) dn (#) = | c(#) dn (t). 


L'égalité (3.7.19) est donc valable pour tout couple œ (À), c (f) sa- 
tisfaisant aux conditions 


| [P(Q)F dA< oo, | | c (4) [ dt < oo 


— oO 


(où c (é) est une transformée de Fourier du type (3.7.18) de la fonc- 
tion p (À)). Partant des fonctions œ (À) et c (t) satisfaisant aux con- 
ditions supplémentaires 


| [PAF dA< 0, | | c (8) | dé < 00 (3.7.20) 


(dans ce cas, la transformation de Fourier inverse donne œ (4) = 


— | eïktc (t) dt) on peut, moyennant le passage à la limite, appli- 


—œo 
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quer l'égalité (3.7.19) à des fonctions quelconques c (t) absolument 
intégrables et à leurs transformées de Fourier: 


p (À) — f eïñtc (t) dé. 
Passons directement à un processus aléatoire Ë ({) représenté par 
l'intégrale stochastique (3.7.13) : 


E&)= |uw(t—s)dn(s). 


Nous appellerons caractéristique spectrale *) d’un système linéai- 
re de fonction de pondération w (f) (w (t), — oc << 1 ©, est 
asbolument intégrable) la fonction 

o (à) = | ep (t) dt. (3.7.21) 


Soit p (iÀ) la caractéristique spectrale telle que | | o (A) [* dA < 


<< co. Il est évident que la fonction c (s) = w (t 5), — DO XLS< 
<Z co, satisfait aux conditions (3.7.20), de plus 


| eiMc (s) ds = eïht | esp (t— s) ds = et (ià). 
Donc, en vertu de la formule (3.7.19) on a 
E (t) = | w (t—s) dn (s) = | elto (iÀ) dY (4). (3.7.22) 
L'égalité 
à 
D(À)— | p (ià) dY (à) (3.7.23) 


Ld 


*) Dans les applications on caractérise généralement un système linéaire 
par la fonction dite de transfert q (p) liée à la fonction de pondération correspon- 
ante w (t) (w (t) = O pour t < 0) par une transformation de Laplace, soit : 


p (p)= | ePiw (t) dt, 
0 


voir par exemple J. Laning, H. Battin, Random processus in automatic control, 
New York, McGraw-Hill, 1956. 


$ 7] PROCESSUS ALÉATOIRES STATIONNAIRES 215 


définit un processus aléatoire complexe à accroissements non corré- 
lés de valeur moyenne nulle et de densité structurale 


fA)= IGN EE. (3.7.24) 


En effet, en désignant par AO = © (4.) — ® (4,) l'accroissement 
sur l'intervalle correspondant A = (À, À), on a 


MAO = 0, 


M|ADF=M| Î P (A) Xa (2) SW (A) | = _ a For * dÀ, 
A1 


M (10850) = M | ( PA) La (dE (A) | EU) La dE (à) | = 


—œo 


= Î | (2) F Xa, (4) Fas () dh = 0 


quels que soient les intervalles disjoints Ai, A2. 
A partir de la définition générale de l'intégrale stochastique on 
déduit aisément 


E (t) = | eg (1) dY (à) = | et a® (à). (3.7.25) 


— 00 —œo 


On a ainsi obtenu la représentation spectrale du processus station- 
naire E (4) (voir (3.7.4) et les suivantes). 
On a donc le résultat suivant. 


Théorème. Tout processus aléatoire stationnaire E (t) du type 
(3.7.13) admet la représentation spectrale (3.7.4); sa densité spectrale 
f (À) est exprimée par la formule (3.7.24). 


2. Transformations linéaires. Exemples. Soit E (4), — oo <1t< 
<< , un processus aléatoire stationnaire admettant la représenta- 
tion spectrale suivante : 


O0 


E () = | ei dO (À). 


Soit T = [a, b] un segment fini ou infini sur l'axe des temps 
— 00 <Z t Loo. Désignons par Lr (f) l’ensemble de toutes les fonc- 


tions (A), — o<À< oo, qui sont soit du type > cRe’ntr 
k=1 
(où £,, ..., th E T), soit des limites de ces fonctions, à savoir 
p(À)= lim m.q. À cye "à (3.7.26) 
k 
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dans le sens de la convergence en moyenne quadratique par rapport à 
la distance 


I qu (À) — qe A)I= Î ÉTOEAOISICE 2e 


où f (À) est la densité spectrale du processus stationnaire E (t) envi- 
sagé. 
Désignons par À (T) l’ensemble de toutes les variables du type 


n= | p (A) d® (à), (3.7.27) 


où p(À) E Lr (f). Pour q (À) = © ce à, les variables mentionnées 
k 


sont des combinaisons linéaires des valeurs correspondantes E (£,), 
LA € T : 


n = POLICE [[S ce | dD (1) = 
—oœ k 


=S' 0 Î ex dOD (à) = > Chë (ta), 
R 


et dans le cas général sont des limites (au sens de la convergence en 
moyenne quadratique) pour ces combinaisons linéaires : 


= | p(A)d® (à)= lim m.q. D' cuË (#4). (3.7.28) 
R 


Exemple (intégration). Soit c (f), — oo {<< œ, une fonc- 
tion continue par morceaux, nulle en dehors du segment fini T = 
— [a, b], et o (À) sa transformée de Fourier: 


b 1 
p (À) — eïiMtc(t) dt = lim 5 e "Mac (tx) At, 
hk=—0 
où At, = tyui — tn, k = 0, 1, ..., n — 1, et la limite des « som- 


n—1 
mes intégrales » œ, (À) — 2 etre (£:) At, est prise comme habi- 


tuellement pour une partition du segment [a, b] par des points #4, — 
= 4, ly, ... — b de plus en plus nombreux (lorsque max Af, — 
kR 


— 0). Ilest facile de voir que la relation limite est également vérifiée 
dans le sens de la convergence en moyenne quadratique, soit : 


lim m.q. | | p (À) — n (À) [°F (À) dà = 0. (3.7.29) 


—œ 
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En effet, pour e => 0 quelconque on peut choisir a tel que 


f (À) dà < e (rappelons que la densité spectrale f (À) est une 


1>a 
ñn 


fonction intégrable); la suite q, (4) = Ÿ e‘Mr © (4) At, est bornée 


— 
— 


” 
Ce 


et converge vers p (À) = | ektc (t) dt uniformément par rapport à 


À sur chaque intervalle fini: : - 

IpAÜ—-mOI<e pour |A |<a; 
pour tous les » suffisamment grands (par exemple, pour nr > n.) 
on a 


PO) MP d= | 1p(@)— 0 A) PF A+ 
— 00 [A2 1>a 
+ flom-mr mac | fA)dt+e | FA) 
—a [A1>a —a 


quel que soit e > 0 donné à l’avance (C, C, étant des constantes 
quelconques). 


Considérons la variable n = | o (4) dO (À) de l’espace A (T): 


n= lim m.q. Î Pn (A) dO (À) =lim m.q. S' c(#)E (tx) Ata. 
— 00 k=1 
Nous appellerons intégrale la limite en moyenne quadratique des 


n 
« sommes intégrales» D c(t,) E (4x) At, Dit: x 
k=1 


O0 


| c(OE()dt=limmq. D c(#)E (tx) Ata. 


— C0 k=1 


*) Notons que pour le processus aléatoire n (t), a < t << b, dont toutes 
les trajectoires possibles sont intégrables en valeur absolue (ici n (t) = c (1) & (4)), 
la limite en moyenne quadratique des « sommes intégrales » 


b 
ñn 
lim m.q. > N(tx)Atz= fntas 
R=1 


a 
en tant que variable aléatoire est identique avec la probabilité 1 à l’intégrale 
b 
ordinaire | n (t) dt de la trajectoire n (t), a < t  b, donnée (voir, par exemple, 


chapitre IV de l’ouvrage de I. Guikhman et A. Skorokhod cité précédemment). 
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Dans ces notations 


| p (À) dO (À) — | c(t)E (6) dt. (3.7.30) 
Par le passage à la limite la formule (3.7.30) s'applique à des fonc- 
tions quelconques c (f), — o0 << {<< oo, absolument intégrables et 


à leurs transformées de Fourier œ (À), — 00 << À << co (comparer 
avec (3.7.19)). 


Exemple (dérivation). Considérons la dérivée en moyenne 
quadratique 
E’(t)—=lim m.qg. £UHAD—EU 
At-0 At 


du processus aléatoire E(£{). Pour un processus stationnaire E(t) — 
= el dO (À), lorsque cette dérivée existe, on a 


— 00 
00 


Er (= | ie a® (h. (3.7.31) 


Evidemment, la limite en moyenne quadratique mentionnée 


At-0 
et l'intégrale stochastique | iheïnt dO (À) n'existent pas toujours 


mais si et seulement si 


| A2f (4) dh< oo. 


En effet, sous cette condition la fonction (À) = iAeïkt est la limite 
iMt+At) __ iAt 
——— , At—+ 0, dans le sens de ;la convergence 


en moyenne quadratique et 


des fonctions 


O0 


At — C r'eiAt+At) it. 
SUITE 0 | | dO (À) —+ | p (À) dO (À). 


— 00 —œ 


Exemple! (formule d'inversion). Considérons la formule 


(3.7.30) pour 


pA)= [Aa(u)E(A—u)du, —0o<i< 00, 
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où À = (4,, À.) est un intervalle fini, ga (À) son indicateur (ya (À) = 
—= 1 pour À € À et ya (À) = O0 pour À 6 A) et 


1 2,9 a? 
S (À) = —}/20?. 
DE * 
la fonction c({f) correspondante est 
eiet _,—ihit nn 
c(t)=s— LT et (À) d\k=— ed, — O0 TL {<L 00,. 


—œo 


On remarque sans peine que pour & —+ 0 les fonctions y (À) convergent 
en moyenne quadratique vers la fonction #4 (À) (ceci peut être dé- 
montré, tout comme la relation limite (3.7.29), si l’on s'appuie sur 
le fait que les fonctions (À) sont bornées et convergent vers ya (À) 
uniformément par rapport à À, à condition de poser —a < À < À — 
— 8, A +e LL — e, À + 8 LÀ La pour a aussi grands 
et e aussi petits que l’on veut). Comme les variables 


© FO —ihet_ —ikit 0 

| p (À) dO (À) — _ À SE - (4) dt 
appartiennent à l’espace H (T) pour 7 = (— oo, oc), celui-ci 
contient également la variable A® = © (4.) — ® (1,) 


AD— | ya (À) d® (À) = 


| 4 À e-iet_e-iMt 0 
=lim m4. — | LE 4-o PE (pdt.  (3.7.32) 

o—0 — il 
L'expression (3.7.32) est justement la formule d'inversion; elle 
permet de définir le processus aléatoire © (À), — oo << À << oo, 
à accroissements non corrélés figurant dans la représentation spec- 
trale du processus stationnaire E ({) d’après sa trajectoire E (£), 


— 00 <T {I <T oo. 


Considérons un système linéaire de fonction de pondération 
w (t) absolument intégrable 


w(t)=0 pour t<<0, À lu (#) Fdt< o, 
0 
et de caractéristique spectrale q(iÀ) telle que 


| 1pGA) PA < co. 


—® 
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Supposons que l’on ait à l’entrée de ce système un processus 
stationnaire au sens large 
n (#)= | ed (A) (3.7.33) 
de densité spectrale g (À). Sous cette action extérieure le système dans 
l'intervalle de temps entre 0 et £ passera de l’état initial (par exem- 
ple, £ (0) = 0) à l’état 
t 
E (t) — | w(t—s)n(s)ds. (3.7.34) 
0 
En vertu de l’égalité générale (3.7.30) le processus aléatoire E (4) 
peut s’écrire | 


E(#— | ete (A) dE (A), 


{ 
où la fonction sous l'intégrale œ: (À) = | e”"tksw (s) ds converge pour 


0 
{— oo vers la caractéristique spectrale œ (iA). On voit aisément que 
le processus aléatoire Ë (t) converge en moyenne quadratique vers un 
processus stationnaire du type *) 

E (4) — | eiktp (iA) dY (À). (3.7.35) 
La formule (3.7.35) donne en fait la représentation spectrale de ce 
processus stationnaire E (4) qui s’établit au cours du temps (£{ —> co) 
à la sortie d’un système linéaire de caractéristique spectrale  (ià), 
c’est-à-dire que dans la représentation spectrale 

E(=— | et40 0) 

il y a lieu de prendre 

à 

DAA)= | PUH)AY(H), —oo<A< 00. 


—2œ 


*) Tout comme au point 3, $ 6, on aurait pu envisager le passage à la 
t 
limite (pour to ->— 00) du processus E0 (1) — | w (t—s) n (s) ds vers le processus 


î 
stationnaire E (ft) défini par la formule (3.7.35). 
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A partir de la relation 
À2 


MIDA)—OQN = | [GA 8 ()42 


À: 


on voit immédiatement que la densité spectrale f (À) du processus 
stationnaire & (t) est 


FU = lo Fe. (3.7.36) 


Rappelons que la densité spectrale f (À) caractérise la distribu- 
tion de l'énergie totale du processus stationnaire E ({) — 


É M dO (À) entre les composantes du type Ea ({) = 


contenues dans le spectre de fréquences de la composante corres- 
22 
pondante Ea (t) (à savoir, l'énergie de Ea (t) est | fQ)&.) . La rela- 


À 
tion (3.7.36) montre que pour un choix convenable de la caracté- 
ristique spectrale œ (iÀ) d’un système linéaire on peut amplifier (ou 
A2 


affaiblir) les « oscillations d'entrée » na = | ei dY (à) de l'énergie 
À: 
1e 
Î g (à) d\ qui se transforment en Ea (t) — ( e‘M@(il)dW (À); comme 
nous l'avons déjà noté, l'énergie des” « oscillations de sortie » 
Ea (9 = je d® (A) est égale à froa. où F(A)= (EE). 


Dans Te $ 6 nous avons considéré le comportement du système 
soumis à l’action de perturbations aléatoires homogènes n (t) en 
t 


supposant que n (t) = jn (s) ds est un processus aléatoire à ac- 


0 
croissements non corrélés satisfaisant aux conditions (3.7.14) ; dans ces 
conditions le processus de sortie 


t 
E (t) = | w (t —s) dn (s), 
0 


symboliquement représentable par la formule (3.7.34) à condition 
que l’on y remplace dn (s) par n (s) ds, converge pour { — oo vers 
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un processus stationnaire. Nous avons établi que ce processus sta- 
tionnaire 


E()— | e%tp(a)dY (à) 
admet une représentation spectrale et que sa densité spectrale est 
JA) = + 1 (à) F (voir (3.7.22)-(3.7.25)). 


Formellement, pour g (À) — — un tel processus se situe dans le 
cadre du schéma général décrit précédemment. Certes, au sens de Îla 


définition donnée ci-dessus, la fonction g (À) —-— ne peut servir de 


densité spectrale d’un processus stationnaire habituel ( car pour cette 


fonction j £g (à) dà = œ ) . Cependant d’une manière purement 


symbolique il est commode d'introduire le processus stationnaire 


n (#) correspondant de densité spectrale g (À) — en l’utilisant en 


x 
ce sens que (voir (3.7.19)) 


| canwa(= [ Want) = ETES) 


— 00 oo — © 


Ce processus stationnaire 1 (4) généralisé est habituellement appelé 
bruit blanc. 


Exemple (mouvement pendulaire perturbé). Soit en conclu- 
sion un exemple mettant en évidence certaines particularités du 
comportement des systèmes linéaires soumis à l’action d’oscillations 
aléatoires. Considérons en particulier le mouvement (avec frotte- 
ment) d’un pendule de grande période d'oscillations propres décrites 
par l'équation suivante: 


z"(t) + 2hx' (t) + wix (4) =0 
et données sous forme explicite par la fonction 


z (9 = 4e" sin (wt+0), DV 


La fonction de transfert d'un tel système est 


(p) = 1, 
PUIT ETE hp + oi 


(la caractéristique spectrale est égale à p (£À)). 
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Supposons que ce système se trouve sur un navire et que la fré- 
quence w des oscillations propres du pendule soit très inférieure à 
celle de ballottement @ du navire (0 <& (2). 

Si l’on suppose que par suite du ballottement le pendule est 
soumis à des secousses aléatoires apparaissant à des intervalles de 


temps petits de l’ordre de Af — . , que cette perturbation extérieu- 


re n ({) est homogène dans le temps et donc peut être formellement 
considérée comme un «bruit 
blanc» *), alors le mouvement per- 
manent du pendule n’est autre qu'un 
processus stationnaire de densité 


spectrale f (A) = | (à) F. 


Rappelons que la densité spec- 
trale caractérise la distribution de 
l'énergie du processus aléatoire 


00 


. FA oh? À 
E (4) = { ei d@ (À) par les com- 
— Fig. 24. Allure générale de la den- 
posantes de ses «oscillations élé- sité spectrale. 


mentaires » suivant la fréquence À, 
c'est-à-dire que l’amplitude moyenne des oscillations aléatoires 


2,2 
données par l'intégrale stochastique | e‘kt dO (À) est égale à 
À! 


f (à) dA. Dans notre cas la densité spectrale est 


y 


02 1 | 
FO = Gr: 


elle admet un maximum pour À° — w* — h* (nettement accusé 
pour un « coefficient de frottement » k petit) et décroit assez rapi- 
dement lorsque l’on s’éloigne du point du maximum (fig. 24). Ceci 
signifie que dans le processus aléatoire E ({) on a une prédominance 
nette des « oscillations élémentaires » de fréquences voisines de la 
fréquence propre w du système envisagé. 

A titre de comparaison notons que si l’on considère l’action 
extérieure (due au ballottement du navire) comme une oscillation 
harmonique de fréquence Q, le pendule effectuera des oscillations 
forcées de fréquence Q, ce qui diffère qualitativement du résultat 
obtenu ci-dessus. 


*) Pour des actions de ce type de processus aléatoire sur un système linéaire 
voir également p. 1, 8 6 
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$S 8. Processus de diffusion 


1. Processus aléatoires représentables par l'intégrale stochas- 
tique de Ito. Imaginons un certain système qui, soumis à une action 
extérieure y (t), { > ty, change son état de phase z (é) suivant la loi 


z'(t) = a(t) + o () y (), 


ou sous forme intégrale , 
t 
z(t)=z(t)+ | a(s)ds+ | o(s)y(s)ds, 
to to 


où les coefficients a (f) et © (t), en tant que paramètres du système, 
peuvent dépendre non seulement du temps f, mais également de 
l’action y (s), t LS Lt. Lorsque les perturbations stochastiques 


n (8), t > to, agissent sur un tel système, le processus aléatoire 


t t 
E(D=E (t)+ | a(s)ds+ | o(s)dn(s), (3.8.1) 
to to 


{ 
où n (é) = | n (#) dt (comparer avec le point 1, $ 6) peut bien ser- 


to 
vir de modèle convenable de son comportement. 


Nous allons considérer ci-dessous les processus aléatoires E (f) du 
type mentionné en supposant que n (£), &t >, est un processus 
«type» de mouvement brownien *) de valeur moyenne nulle et de 
coefficient de diffusion unité (M [n (4) — n (4)]° = £ — t#,) et que 
les coefficients a (t), © (t) dépendent en général de n (s), 4 <Ss Lt 
(plus précisément, a (t) et © (t) sont pour chaque f des variables aléa- 
toires dont les valeurs à l'instant { sont définies univoquement par 
la trajectoire du processus aléatoire n (s), 64 <s < t). 


Passons maintenant à la définition exacte des intégrales stochas- 
tiques contenues dans la formule (3.8.1). 

Soit o (t) une fonction réelle constante par morceaux sur le seg- 
ment 4 <t<C, prenant pour une certaine partition de celui-ci 
par les points cy = do, lys - - ., fn —= ca des valeurs aléatoires o (4) 
sur chacun des intervalles À, = (f», tp41), k = 0, ..., nr — 1. Sou- 
lignons une fois de plus que les valeurs de ® (f) sont des variables 
aléatoires. Posons 

c2 n—1 


| p@at= 3 pt) At, 


C1! R=—0 


*) Autrement dit, n (t) est un « bruit blanc » gaussien. 
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Où Ag = try — tr, k = 0, ..., nr —1. Il est clair que l'inté- 
grale définie de la sorte est douée des propriétés habituelles d’addi- 
tivité et d'homogénéite : 


{ UUAOEESCAUI)LUEET | Pi (£) dE + Re | pe (t) dt, (3.8.2) 


C1 C1 
de plus 
c2 c? 
Mioua= | tMpta (3.8.3) 
ct ci 
et 
c2 c2 
lfeoa)<S ie (3.8.4) 
C1 ci 
(où |[n || = V Mn est la valeur moyenne quadratique de la varia- 


ble aléatoire n). 


Soit maintenant o (t) une fonction aléatoire sur le segment c, < 
<t<c,:, pouvant s'écrire comme la limite en moyenne quadrati- 
que des fonctions aléatoires q, (t), nr = 1, 2, ..., constantes par 
morceaux, plus précisément 


IL ® (é) — p, (I — 0 pour n —+ 0 (3.8.5) 


uniformément sur t, ©, < t L C2. Il est évident que pour 7, m —- co 
on a également uniformément par rapport à £ 


I Pa (9) — Pm (À) IE I Pa À) — p EN + Pn @) — p D I 0 


et par conséquent 


c2 


| Ï Pn (0) dt À Em (9) dt || < f Pn (£) — Fm (£) 1] dt + 0. 


C1 C1 c1 


Ce qui montre l'existence de la limite en moyenne quadratique 
cz 
lim m.q. | Pa (£) dt, la même pour une suite quelconque w, (t), 
ñn— 00 


n = 1,2, ..., du type mentionné ci-dessus. Posons 


cz 


(FTC dt—]lim m.q. À n (#) dt. (3.8.6) 


C1 C1 


Il est facile de voir que pour un tel passage à la limite les relations 
(3.8.2)-(3.8.4) restent vraies. 


15-0521 
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Notons que pour une fonction aléatoire œ (t) uniformément con- 
tinue en moyenne quadratique on a pour At — 0 


I @ ( + At) — pt) 1-0 (3.8.7) 


uniformément par rapport à {,  <t< CA; l'intégrale stochastique 
définie par l'égalité (3.8.6) est la limite en moyenne quadratique 
des sommes intégrales ordinaires : 


n— 1 


[ P(£) dt=]lim m.q. D @ (êx) At: 


C1 k=0 


limite prise pour une partition du segment [c,;, c.] par les points 
Ct = dogs pr + - + ên —= ©, en intervalles At, = {y+1 — fx, de plus 
en plus petits, quand max At, —+ 0. 


Passons à la définition de l'intégrale stochastique | o (é) dn (5), 


C1 
où œ (t) est une fonction aléatoire et n (é) un processus aléatoire à 
accroissements indépendants ; nous nous limiterons ici au cas où le 
processus n ({) est un mouvement brownien (de valeur moyenne 
nulle et de coefficient de diffusion unité). 

Ce type d’intégrale stochastique des fonctions ordinaires (non 
aléatoires) œ(i) a été défini précédemment dans le $ 6. Pour des 
fonctions aléatoires ® (t) il est important de noter l’hypothèse selon 
laquelle 

quel que soit u, les accroissements n (t)—n (u), t > u, ne dépen- 
dent pas des variables aléatoires p (s), Ss & u. 

Soit  (t) une fonction réelle constante par morceaux prenant des 
valeurs aléatoires œ (£,) sur les intervalles correspondants A, — 
= (4, tn+1), k = 0, ..., n — 1. Posons 


n—!{ 
[ pH dn(#= D pt) Ant), | 
U1 k=0 
où An(é,) = n (tu+s) — n (4x), k = 0, ., nn —1Â. Il est clair 


que l'intégrale définie de la sorte est douée des propriétés habituel- 
les d’additivité et d’homogénéité (comparer avec (3.8.2)). 

Nous allons supposer que M [œ (t)l° pour toutes les valeurs 
de t,c, <t<c,. À partir de la condition d'indépendance des accrois- 
sements n ()} —n(u), t > u, des valeurs q (s), s < u, on déduit 


M Lo (4) -An (4)1 = Mo (4:)-M An (&:) = 0, 
M [œ (#4) -An (:)P = M @° (4:)-M [An (4) = Mo (4) At, 
k=0,...,n—1; 
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de plus, pour tous les À =£ j (k << j pour fixer les idées), on obtient 
M [o (4) An (4) -@ (6) An (1 = M Ip (é:) An (4) p GX 


On a de toute évidence 
M [ o@)an(#) —0, 
| CIOES TO) ER RLIONE (3.8.8) 


de plus | | | 
Mfouano.(vaamcd]- (More. (389) 


c1 


Soit maintenant œ ({) une fonction aléatoire sur le segment « < 
<t< c pouvant s’écrire comme la limite en moyenne quadratique 
des fonctions p, (t), r = 1, 2, ..., constantes par morceaux; plus 
précisément, supposons remplie la condition (3.8.5). On a alors 


ce C2 


| | Pa (é) dn (té) — | Pm (é) dn (t) [' — [ IL Pan (&) — Pr (é) I dt + 0 


ox | CE | 


pour nr, m—> , d’où l'existence de la limite en moyenne quadrati- 
c2 
que lim m.q. | Pn (£) dn (+). On voit aisément que cette limite ne dé- 
ne 00 


pend pas du choix de la suite ®, (t), n = 1, 2, . .., satisfaisant à la 
condition (3.8.5). Posons 


lb 


ET an (#) = lim m.q. | 9h (9) an (9. (3.8.10) 


c1 


Il est manifeste que pour ce passage à la limite les relations (3.8.8) 
et (3.8.9) s'appliquent aux fonctions limites o (f). 

Notons que pour des fonctions  (£) uniformément continues (en 
moyenne quadratique) l'intégrale stochastique définie par l'égalité 
(3.8.10) est la limite en moyenne quadratique des sommes intégrales 
correspondantes : 


c2 n— 1 
| dn(t=lim m.q. 2 (#4) An (tr). 
cf k=—0 


Après l'introduction des intégrales stochastiques du type (3.8.6), 
(3.8.10), on peut en connaissance de cause parler du processus aléa- 
toire E ({) représentable par la formule (3.8.1). 


15° 
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Nous supposons que les fonctions aléatoires a (f) et © (t) dont les 
valeurs sont univoquement définies pour chaque f par le processus 
aléatoire n (s), 6 < s < f, sont uniformément continues en moyenne 
quadratique sur chaque intervalle borné. Cette hypothèse entraîne 

t 


l'existence de l'intégrale fa (s) ds, et comme les accroissements 


{ 
nt) —n(u), t > u, quel que soit u, ne dépendent pas de n (s), 
lt) LS EL u, ils ne dépendent pas non plus des variables © (s), s < u, 
t 


d'où l'existence de l'intégrale stochastique fo (£) dn (+) définie 
to 
ci-dessus. 

Considérons le cas où le processus aléatoire & (£) admet la repré- 
sentation par l'intégrale stochastique (3.8.1). Nous supposerons ici 
les processus aléatoires @ (4), © (£) et n (t) (ainsi que le processus 
aléatoire Ë ({)) donnés et nous nous intéresserons uniquement à la 
relation exprimée par la formule (3.8.1). 

Il est clair que les valeurs de £ (£) données par cette formule sont 
univoquement définies par la valeur initiale E (4) et le processus 
aléatoire n (s), 4 <s Lt; c'est justement ce type de processus aléa- 
toire £ (#4), 4 > to, que nous allons étudier, il sera démontré no- 
tamment que la relation intégrale (3.8.1) est une conséquence de la 


relation locale 
AE (4) — a (t) At + o (t) An (#) (3.8.11) 


(où AE (14) = Et + At) —EË(t), An ()=n(+At)—n(s) et At + 
—+ 0), que nous entendrons dans ce sens que *) 


M {AE (4) — [a (t) At +o (t) An (fl In(s), s << t} = o (At), 
M {AE (4) — [a (t) At + © (t) An (9)1}° = o (Ab), (3.8.12) 


où o (At) sont des infiniment petits d'ordre supérieur par rapport à 
At, plus précisément 
Je CI L_,0 pour M—+0 
uniformément par rapport à £ pour chaque intervalle fini 4, << t< 41. 
Nous allons nous arrêter sur ces relations de façon plus détaillée. 
Dans la première d’entre elles, a (t) et o (t) sont univoquement dé- 


*) Voir le $ 2 du chapitre IV. Dans la suite de ce paragraphe nous allons 
utiliser l’appareil des espérances mathématiques conditionnelles, y compris la 
formule de l'espérance mathématique répétée du type 


M {M {E/n]|t}=M {616}, 
où grossièrement l’ensemble des conditions « £ » est déterminé d’une manière 
univoque pour toutes les conditions données «7»; pour plus de détail voir 
l'ouvrage déjà cité de I. Guikhman et A. Skorokbod. 
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finies par n (s), s < {, et pour une trajectoire fixée n (s), s < £, sont 
tout simplement des constantes, alors que l’accroissement AE (+) 
est aléatoire et sa distribution dépend de la trajectoire correspondan- 
te n (s), s Lt; par contre, l’accroissement An (t) n’en dépend pas. 
On a alors pour l'espérance mathématique conditionnelle (en fixant 


n (s), S< t) 
M {o (4) An (t)in(s), st} = © (t) M An (ét) = 0, 
M {AË () —la(t) At+o(t) An(lint(s), s<t} = 
= M{AE() In(s), s&t}— a (1) Ai. 
Ensuite, la fonction aléatoire a (t) étant supposée continue en moyen- 


ne quadratique, la variable || a (£) || est bornée sur chaque segment 
to LtLt, et il est aisé de voir que 


IL AË (4) — La (#) At + o (4) An (#1 IP = || AË (4) — © (4) An () LÀ + 
+ o (At). 

Aïnsi, les relations (3.8.12) peuvent être entendues en ce sens que 
M {AE (t) Int(s), st} = at) At +o(At), (3.8.13) 

II AË (8) — © (#) An (9) IF = o (At). (3.8.14) 


Lemme Î. Pour t < t, quelconques, sous la condition (3.8.13), on 
a l'égalité suivante: 


{2 
M4 ()—E (H)1n(s), s<t}=M{ (at) din(s), s&u}. (8.815) 
{1 


Démonstration. Divisons le segment [£, t.] par les 
points Ëj — So, Sy, « - +, Sn — ©, en intervalles de longueur As, = 
= Sh+1 — Sh) k = (, ... n — 1. Posons 

0 (As;) = M {AË (s:) — a (sx) Asx In (s), s< sx}, 
où AË(s,) = E (sx) — E (sx), k = 0, ..., nr — 1. Par hypothèse, 
eee 0 uniformément par rapport à À pour max As, —+0. En 
prenant une deuxième fois l’espérance mathématique conditionnelle 
(cette fois-ci sous la condition n (s), s< 4, où 4 Ls)ona 


M {o (Ass) In (s), s< ti} — 
= M {AE (s;,) — a (s:) Ass ]n(s), s< 4}, 
d’où l’on obtient que 
II M {AË (sx) — a (sx) Asxfn(s), s<t}ll = 
= VMIM {0 (Asa) [n (5), sa} SV MIM {0 (sx) [n (5), Shi — 


=|lo(As:)|l, k—0, ..., n—1. 
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T1 est donc facile de voir que 


| M{E(és)—E(4)|n(s), s<4} —M { fa (t) dt|n (s), s<t} |< 
{1 


< | 5 M{AE (sx)— a (sx) Asu|n(s), s&ti} | + 
Rk=—0 


n 


+]m{ L'atyar— Sa (a) Asa] n (9. s<h }|< 
ti k=0 


5 Il o (Asx) |] +| Late a—S a (sx) Asx ]—0 
k—0 î 


h=—0 


pour max As;—0 et par conséquent 


{2 
]MEE @2)—E(@in(s), s<h}—M { fatdtin(s, s<u}]=0, 


ti 
c’est-à-dire que l'égalité (3.8.15) est vérifiée. 


Passons du processus initial E (£) au processus aléatoire 
t 


E(#)—E (8 —# (60) — | a (5) ds. (3.8.16) 
{0 
A partir de l'égalité (3.8.15), il vient : 
M {AË () In (5), s<t} = 0. (3.8.17) 
En plus de la condition (3.8.14) pour les accroissements 


t+At 
AË(t) = AË (4) — | a (s) ds 
t 
on a de toute évidence 


IL AË (4) — o (4) An (e) IF = o (A6), (3.8.18) 
où o (At) est un infiniment petit du même type que celui de (3.8.14), 
c'est-à-dire que 20 0 uniformément dans chaque intervalle 
fini b LtLt. 
Lemme 2. Sous la condition (3.8.14) on a l'égalité suivante : 
t 


E (4) = | c (s)dn (s). (3.8.19) 


to 
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Démonstration. Divisons d’une certaine manière le 
segment [4, t] et estimons la différence correspondante, soit : 
n— 1 


n-— { 
E()— 2 0 (x) An (#)= 2 AË (44) — (#4) An (4x)] 


I1 découle de la condition (3.8.17) que pour f, = t; (posant f, < t;) 
MAË (4) AË (45) = M IM {AË (tx) AË (4) In (s), s<t5}l = 

= MIAË (4x) M {AË (4) [n (s), s&ts}1= 0, 
car pour n (s), s < t;, fixés, les grandeurs AË (4) sont des constan- 
tes: semblablement, | 

M IAË (tx) o (é) An(t)1=0, Mo (tx) An (te) 0 (#5) An (#1 = 0. 
D'où, compte tenu de la condition (3.8.18), on a 
n— Î n— 1 

IE G— 2 6 (4) An (8) [F= 2 I AË (ex) — 0 (4x) An (#2) 1° = 


—=0 
n—1 


= Ÿ o(Atx)—+0 
k=—1 


pour max At, —+ 0, c'est-à-dire que les « sommes intégrales » 
n— 1 


D O(t:) An(t:) ont pour limite ë (4) et par conséquent € (4) = 
h=0 


t 
— | G(s)dn(s), ce qu'il fallait démontrer. 
L'expression 
dE(t) = a(t) dt + © (t) dn (t) (3.8.20) 


est appelée différentielle stochastique du processus aléatoire E (t),si 
t 


{ 
E(#)=E (to) + Üa(s)ds+ | o(s)an(s). 
to 


to 
Les lemmes 1 et 2 donnent ensemble le résultat suivant. 


+ Théorème 1. Sous la condition (3.8.12) (équivalente à (3.8.13), 
(3.8.14)) le processus aléatoire E(t) admet une différentielle stochastique 
exprimée par la formule (3.8.20). 


Recherchons la différentielle stochastique de la fonction aléa- 


toire 
St) = {é, n (t)), (3.8.21) 


où n (£) est le processus du mouvement brownien, et œ (f, x) une 
fonction réelle (non aléatoire) des variables t et x admettant les dé- 
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nr . ô®  ô 0% 
rivees continues T° D et ze * 


calculs donnons immédiatement la réponse 


CL , 
dE (t) = [RAD + 1 TE | a+ PCr0) (t). (3.8.22) 


Oz? 


Pour préciser le but de nos 


Soulignons ici une particularité de la différentielle stochastique 


comparativement à la différentielle ordinaire 
dp(£,n(t ô@ (t, n (4 
(= EIO 4, FCO) (y 


des fonctions E (t) et n (4) dérivables (non aléatoires), à savoir dans 
la formule (3.8.22) on a un terme supplémentaire 7 6710) dt 


apparaissant, comme nous allons nous en convaincre, du fait que 
pour le mouvement brownien considéré n (it) de coefficient de 
diffusion unité M [An (4)]° = At. Dans le cas général *) 


Min (as, k=1,2, ...,  (3.8.23) 


EUR 


ce qui introduit une certaine particularité dans l'estimation du 
terme résiduel 


0 (At) = [ PEAR T (t)+ An (4) __ dp(s. RERO | + 
+ : É (e, 10 2An (4)) _ 9 eu (2) ] (3.8.24) 
(où [6;], [81<1) de la relation 
AE (= 28 n 0) p4 4 EN OD a (+ 
+586 70) jAn(HI+o(AT,  (3.8.25) 


obtenue à partir de la formule de Taylor pour la jonction o (f, x). 
A! 

Supposons de plus que les dérivées PTE + et + vérifient la 
condition de Lipchitz (pour la fonction y (4. x) celle-ci 
signifie que 

[y (£ + At, z + Az) —y(t, x) |< C; | At] + Ce: | Az |, 


*) Pour une variable gaussienne n de valeur moyenne nulle et de 


variance o? dont la fonction caractéristique est t que net, — 0 < 
<u<oo, la formule qth (0) —i-ÀMnÀ, k=—0, 1, ..., donne 
Mn°* — (2%) ! OR, k—=0, 1,.... 


kI2R 
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où C:, C, sont des constantes TON Il en résulte que les fonc- 
2 

tions aléatoires 2 ER L (£)) | 2 En @) à 7 C2 (?)) 

mément continues en moyenne  ratique et par conséquent les fonc- 


et | + | sont uniformément bornées sur cha- 


sont unifor- 


tions SE 


que intervalle fini bh LtLt,. Vu ce qui vient d’être dit et le fait 
que les accroissements An (ti) ne dépendent pas de n (s), sf, on trouve 
aisément à partir des relations (3.8.23)-(3.8.25) que “les fonctions 


9 1 dœ(t, dq (t. 
a (t) = p(, no, 7 : PCA E) + 6 (t)= q{ 10) 


satisfont aux conditions (3.8.12), de plus pour les grandeurs 0 (At) 
figurant dans ces conditions, sur chaque intervalle borné #, < { < 4,, 
on a l'estimation | o (At) | < C (At})*/*, où C est une constante. En 
vertu du théorème 1 le processus aléatoire envisagé E (t) = œ (£, n(t)) 
a la différentielle stochastique dE ({) = a (t) dt + © (t) dn (+). 


t 
Exemple. Calculons l’intégrale | n(s)dn(s), où n'(t), 


î 
t > to, est le processus du mouvement brownien. Essayons de trou- 
ver un processus aléatoire du type E (£) = œ (4, n (t)) dont la diffé- 
rentielle stochastique est dE (t) = n (ti) dn (t); pour un tel processus 


on a Îne dn (s) = E (4) — E (to). 
En vertu de la formule générale (3.8.22) la fonction cherchée 

p (t, zx) doit satisfaire aux conditions suivantes: 
dp , 1 dy O, 0 


— —< — — = Z. 


ot 2 ôÔôx° GE 
Il est facile de trouver 


pt, z)=L2+e(s) et c'(9+4=0, 
d’où ®(f, 2)= + (a — 1). On obtient finalement que 


1 
Ÿ n (9) dn (5) =+ in? (9 — n° (to) —(—#0)]. 


I] est'utile de noter que pour une fonction dérivable ordi- 
naire n (t) l’intégrale correspondante est 


t 
À n (0) an (8) = Zn (9) — n° (ko)]. 
Lo 


Considérons un processus aléatoire markovien E(t) de dif- 
férentielle stochastique a (£) dt + © (t) dn (6). 
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Nous allons supposer que les valeurs des fonctions aléatoires 
a (t) et o (t) ne dépendent explicitement que de £ et de l’état courant 
E (1), à savoir a (t) = a (t, E (t)) et © (#4) = o (t, E (t)), où a (t, x) et 
o ({. x) sont des fonctions (non aléatoires) du couple de variables #, 
z. Grossièrement, ceci signifie qu'à partir de chaque état E (t) = zx 
le processus passe dans le temps At à l’état x + AË (£), où 


AË (4) — a (4, 8 (4) At + o (4, E (t)) An (). 


Précédemment nous avons expliqué cette relation en ce sens 
que les conditions (3.8.12) se trouvent vérifiées. Nous allons quelque 
peu renforcer ces conditions en les remplaçant par les relations sui- 
vantes : 


M {AE (4) — La (4, & (4) At + o (6, & (2)) An (9] | & ()} = o (Ab), 
(3.8.26) 


M {IAE (1) — a(t, E (1)) At — o (4, & (4) An (FT E (4)} = o (Ab), 


où o (At), en plus du sens qu'il avait précédemment, signifie que 
pour E ({) = x quelconque fixé c’est une grandeur infiniment petite 
d'ordre supérieur à At—>0 uniformément par rapport à { dans 
chaque intervalle borné 4 <<, 


ja( D i<C G<Klo(zI<C 


pour des constantes positives €, C, 

Montrons que sous la condition (38. 26) le processus aléatoire 
markovien E (t) fait partie de la classe des processus de diffusion dont 
la distribution est étroitement liée aux équations différentielles 
décrivant les processus physiques de diffusion (nous allons étudier 
ces équations au point suivant). 

Donnons une définition formelle du processus de diffusion. 
A cet effet, introduisons la notation suivante: 


n pour [n|<E, 
€” | O pour [nl <e. 


On dit qu'un processus markovien E ({) est un processus de dif- 
fusion si, pour € > 0 quelconque, les accroissements AË (4) satisfont 
aux conditions 


P {LA 1e LE () = x} = o (Ab, 
M {(AË ()e LE (D = z} = a (4, 2) At + 0 (A9). | (3.8.27) 


M {(AË (0) 16 () = x} = o°(£, x) At + o (At), 


où la variable o (At) a le même sens que dans la condition (3.8.26). 

Remarquons que si l’on a en vue les accroissements AE (£) eux- 
mêmes et non pas les variables (AË (£)), tronquées jusqu'à €, alors 
à partir des relations (3.8.26) il vient immédiatement que 


M {AE () LE () = x} = a (4, 2) At + o (AD) 
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et 
M {AE (4) JE (4) = x} = o° (6, x) At + o (At). 


Pour passer aux variables « tronquées » (AË (£)). des conditions (3.8.27) 
nous aurons à démontrer plusieurs propositions supplémentaires. 
Nous allons examiner ci-dessous les distributions conditionnel- 
les et les espérances mathématiques pour E ({) = x fixé. 
Considérons la variable n = a (ft, x) At + © (t, x) An (t), où 
An (£) est l'accroissement du mouvement brownien correspondant 
dans le temps At. La densité de probabilité de cette variable est 


py == 
a = a(t,zx) At et o* = o* (4, x) At. De toute évidence on a 


Mn —nel° = | y°p (y) dy = 
ly|>e 


e-w-a*#/20®, où, pour abréger, nous avons posé 


At 


7 Vaot,s 


| z°e— (a /2o(t, xP gz — 0 (At) 


E 
[1> —— 


V'ai 


uniformément par rapport à { et zx pour lat, 2) |<C, C < 
<o({, r) L C+. Estimons la variable AË (f) pour laquelle 


M [AE (4) — nf = o (Ab. 
A partir de l'inégalité || AË (4) — nm I SI] AË—-n + In — "ll 


on obtient également 
M [AE (#4) — ne F = 0 (Ai). 
Puisque | AË (1) F <2[|ne | + | AË (4) — ne FJ, alors 
Xa | AË (0) F2 lxa-e + | AË (0) — ne FI, 


où #1 = 1 lors de la réalisation de l’événement À et #4 = 0 dans 
le cas contraire. Pour l'événement À = {| AË (ti) | > 2e} contenu 
dans l'événement B ={] AËE (t) — n | > e}. on a 


* M ILAE (PF << 21e°P (4) + M [AE (4) — nf] 
et 


P (4)<P (B)S 2 MIAE ()—nef°. 
On obtient finalement 


M [a AË (DIE = M [AE (9) — (AE (#))el & 4M LAË (D — ne = 
— o (At) 
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pour tout & >> 0. Il est maintenant facile de déduire que 
1 
P{IAE(E)1> 2e} 2 M IAE (9) — (AE (£))2e)° = 0 (At), 


|MAË (t) — M (AS CAES M IAE (t) — (AE (#))oe]° = 0 (At). 
et comme || AË (£) |? = o° (£, x) At + o (At), 


[M CAE (0)? — M (AE (0) = II AE (0 IP — I (AE (6) & 

< 2 || AË (2]|-I] AË (9) — (AË (d)æll = o (AS), 
d'où en remplaçant 2e par e on obtient immédiatement la condi- 
tion (3.8.27). 


2. Equations différentielles de Kolmogorov. Considérons un 
processus aléatoire de Markov E (t). Nous allons supposer que pour 
s  t quelconques, sous la condition Ë& (s) = x, la variable aléatoire 
ë (4) possède la densité de probabilité conditionnelle p (s, x. t{, y), 
— 00 <Z y << oo, donc dans l'intervalle de temps compris entre s 
et { le processus passe de l’état x à un certain état y, y << y < y”, 
avec la probabilité 


P{y'GE (D EU IE (S) =2}= jre z, 1, y)dy. 


En fait p (s, x, t, y) nous donne la densité de probabilité condition- 
nelle de la variable E (t), quelle que soit la condition imposée aux 
variables E (u), u 5, y compris E (s) = x, car pour un processus 
aléatoire markovien la variable E (t) ne dépend pas de E(u),u<s, 
pour un état donné E (s) = x. 

Nous allons montrer que la densité de transition p(s,x,t, y) 
satisfait à l'équation de Kolmogorov-Chapman : 


© 


pis tu) | piszu,z)plu,sty)dz  (8.8.28) 
pour s < u Lt quelconques. 

En effet, sous la condition E (s) — x, E (u) = z la variable E (t) 
ne dépend pas de z et possède la densité de probabilité condition- 
nelle p (u,z,t, y); à partir de la distribution des variables E (u) 
et E (t) pour E (s) = x fixé on trouve que 


P (s, T, U, z) D (u, z, À, y), —O00 CZ, y << 00, 
est la densité de probabilité simultanée des variables E (u), & (4) *); 


*) D'une manière analogue pour s<f1 <...<t, quelconques 
Ps, x; tas Ya) P (lis Yas los Yo) - +. p (ln1 Yn=11 tn» Ynr 
— 00 <T Yy» + + +) Un << SO 


est la densité de probabilité simultanée des variables aléatoires E (/1), E (t2), . .. 
.. 8 (,) pour E (s) = x fixé. 
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en intégrant cette densité simultanée par rapport à z, —o0 << z << 0, 
on obtient la densité de probabilité p (s, x, t, y) de la variable 
E (t) (pour E(s) = x fixé). 

Soit £ ({) un processus de diffusion. Il est évident que les condi- 
tions (3.8.27) peuvent s'exprimer directement à l’aide de la densité 
de transition p (s, x, £, y) comme suit: 


pt, z,t+At,y) dy =o(At), 
Iy>e 


(y—z)p(t,z,t+At,y)dy=a{t, rx) At+o(At), (3.8.29) 


ly—x|<e 


(y—z) p(t,z,t+At,y)dy=b(t, zx) At+o(At), 
ly—x|<e 
où, rappelons-le, o (At) sont des infiniment petits d'ordre plus élevé 


que At —> 0 uniformément par rapport à {, dans chaque intervalle 
borné 4 St £t,, et que b (t, x) = o* (4, x). 


Théorème 2. Si Ls densité de probabilité de transition p (s, x, t, y) 


a des dérivées LE, < , — et > — uniformément continues par rapport à y 


dans chaque intervalle fini y y L y”, elle satisfait à l'équation 
différentielle 


— Bas, x) LI b(s, x) LE (3.8.30) 


Démonstration. Soit une fonction continue quelconque 
@ (x) égale à zéro en dehors d’un certain intervalle fini. Posons 


C0 


p(s2)= | pps, 2, 1, y) dy. 


En vertu de l'équation de Kolmogorov-Chapman pour 4, <s<u< 
< t quelconques on a 
TE EU ECECELOERT LE 

_ | plu, z)p(s, x, u, 2)dz. 
Il est évident que la fonction œ (s, x) a des dérivées continues + , 
dp 02 
0x 0x? 
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voisinage du point z (pour w fixé), soit 


qQu, 2)—çq{u, 2) = 24 [SR Lo(s)|(—r7, 


où 
Ôg — SUP — 0 


I:—x1<e 


02p (u, z __ 9? (u, x) 
Ox* dx® 


pour £—> 0. A partir des relations (3.8.29) on obtient 


œ 


P(s, z)— pu, x) — | [@(u, z)—q{u, x)]p(s,zx,u, z)dz — 


— | [p(u, z2)—q(u, z)]p(s, x, u, z)dz2+o(u—s) = 


|:—x|<e 
= 462 (z— zx) p(s, x, u, z) dz + 
LB-xI<e 
+4 [286 2 4 0 (6) ] (z— 2) p(s, z, u, 2) d2+o(u—s)= 
nt 
= {a +50[SE+O() |} (@—s)+o(u—s), 


où O(ô)—0 pour e—>0, d'où l’on voit que 
.__ q(s,u)—q{u, x) _ ôp , 1 dy 
ms — —a(s, x) dx + D) b(s, TL) 


et donc 


—a(s, 2 + DE 
Compte tenu de la définition de la fonction 6, x) cette équation 
peut s’écrire 


( o d 1 dp - 

[ouf Etats z)$E+ro(s 2) 2E ]dy=0, 
où, rappelons-le, o (y) est une fonction continue quelconque, nulle 
en dehors d’un intervalle continu, et par conséquent on doit avoir 
l'égalité suivante: 


1i 
+ +a a (s; z) 2 + b(s, 2) + = 0. 
Le théorème est ainsi démontré. 


Notons que la densité de probabilité de transition p (s, x, t, y) 
coïncide avec la solution fondamentale de l'équation (3.8.30) déter- 
minée par la condition que pour une fonction bornée continue quel- 
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conque (x) 
lim | (y)p{s, x, t, y) dy == (x). 
—s 


Théorème 3. Si les dérivées continues 
(4) d 
Ps rt), le, y)p(s, x, t, y), = LOL y) p(s, x, & y) 
existent, la densité de transition p (s, zx, t, y) satisfait à l'équation 


différentielle suivante: 


2. _ — + la (4, y)p(s,x, t, ++ ge lb (E. y)p(s,x,t, y)]. 


(3.8.31) 


Démonstration. Tout comme dans la démonstration du 
théorème 2, il est facile de définir que pour une fonction quelconque 
(x), deux fois dérivable d’une manière continue et égale à zéro 
en dehors d’un certain intervalle fini, on a la limite suivante: 


lim | [ P(y)p(s, x, {+ At, y) dy—p (x) |= 


= a(t, 2)q'(r) +50 (8 2) 9 (x). 
On a 


oc 


F . 1 C 
Ts | p(s, x, t, no(wyay= lim | p(s,z, t+ 


—œ 


A OPLIOL ES ICE TEL CLIP ETETEE 


X Lim | | p(s, 2, t+ At, y) (y) dy — (2) | dz — 


at-0 4 


O0 


= | P(s,x,t,2) [ a (e, z) P” (2)++b (4, z) p” (2) | dz 


—owû@ 


En intégrant cette dernière expression par parties on obtient 


FA ( p({s,zx,t, y) q (y) dy = ( [+ p(s, T, É, y) | æ (y) dy — 


= [{—-Zuwtunts, 2 tps Ib y) x 


X p(s, x, t, y)] } P (y) dy, 
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d’où, la fonction œ (y) étant quelconque, on déduit l’égalité (3.8.31). 
Le théorème se trouve ainsi démontré. 

On appelle l'équation (3.8.30) équation inverse et l'équation 
(3.8.31) — équation directe de Kolmogorov. 


La méthode des équations différentielles décrite ci-dessus est 
applicable non seulement à l'étude de la densité de probabilité 
p (s. zx, t, y) de la variable E ({) mais également à d’autres variables 
aléatoires liées au comportement du processus de diffusion. 

Considérons, par exemple, l'instant + de la première sortie du 
processus aléatoire E (t), t > t,, de l'intervalle (c,, c.) (en suppo- 
sant que la trajectoire du processus de diffusion E = E£ ({t) est une 
fonction continue, la variable + se trouve être l'instant auquel la 
trajectoire a pris pour la première fois les valeurs z = c, ou zx = c.). 

Désignons par P,. , (4) la probabilité de l'événement À et soit 
M...n l'espérance mathématique de la variable aléatoire n à condi- 


tion que & (s) = x. Par hypothèse, pour un processus de diffusion 
E —E(tona 

Pax{lé(s + As —z|>e}=0o(As (38.32) 
uniformément par rapport à s dans chaque intervalle fini (quel 
que soit le nombre fixé e >> 0); par conséquent, sous la condition 
E (s) = x, la probabilité de se trouver dans l'intervalle de temps 
entre s et s + As en un point quelconque y, [y —zx|>e, est 


une grandeur infiniment petite o (As) d’ordre élevé, du même type 
que dans la relation (3.8.32); par suite on a également 


Ps.s{t &s + As} = 0 (As) (3.833) 


uniformément par rapport à s dans chaque intervalle fini. 
Supposons que sous la condition E (s) = x la densité de proba- 
bilité de la variable aléatoire + soit p,.-. (t). Considérons la fonction 


u(s, x) = Ma, sexp { | U (t) dt} — ( exp { U (u) du } Ps. x (t)dt, 


où U (t) est une fonction continue telle que Re U (t) < 0 et donc 
T 
exp {\ U (+) dt} est borné. Pour U (ft) = it on a, par exemple, 


@0 


u(s, x) — | eiMps, x (t) dt 


—00 


(où p,.+(t) = 0 pour ts), c'est-à-dire w (s, x) est la fonction 
caractéristique de la variable t au point À, —o << À << oo. 
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Pour une variable bornée quelconque n on a de toute évidence 
M: =MesinitT>s +AsiP {t>s+ As} + 
+ M..fnit<s+As}P {T<s+ As} — 
=M,;fnlT>s+As}P {tT>s+ As} + o (As), 


où o (As) est une grandeur du même type que dans la relation (3.8.33). 
On a 


M. x {exp | U(dt|r>s+As}= 


N 
T 


= M,.+ {M{exp jUHadtir>s+AsE(s+As)=n|ir>s+As}= 


s+As T 


—M,. x {exp [ | U (£) dt | Mitas, n exp [ | U (£) dt | } ? 
s+As 


car les relations t > s + As, E (s + As) = n sont les conditions 
impliquées au comportement de la trajectoire Ë (4), ts + As, 
et dans le cas du processus markovien E = E ({) peuvent être tout 
simplement remplacées (comme nous l’avons fait ci-dessus) par la 
condition E (s + As) = n. Compte tenu de 

s+As 


exp| | U(#dt|=1+U (5) As +o(As) = +0 (As), 


s 


on obtient 


u(S, T)=Ms,x {—ronuis+4s, E(s+As)) + o (As) 


ou 
Ÿ Le(s+ As, y)—u(s, )]p(s, 2, s+ As, y)dy+ 


+U(s)u(s, x) As+o(As)—0, 
ce qui pour un processus de diffusion équivaut à la relation 


[u(s+ As, y)—ut(s, x)]p(s, x, s+ As, y) dy + 
ly—x|<e 
+ U (s)u(s, x) As+o(As)= 0. 
Supposons maintenant que la fonction uw (s, x) ait des dérivées 
2 
_ , — et _—_ continues. Alors, tout comme dans la démonstration 


16—0521 
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de l'équation différentielle (3.8.30), on obtient 
[ee (s, 2 154209 ? Az++ 4 dus, x) (1 + 0 (6)) Az* | Se 


Ôx° 
ly—x\<e 
ôu (s, x) 
X p(s, x, s+As, y)dy+U(s)u(s, x) As+o(As)=| + 
La(s, 469 (s, 941 Lots, 7) 26,9 02 TE 2) Le 


x (1+0(8))+U (s)u(s, z) | As+o (As) =0 


avec O(6) —> 0 pour e& —> 0, d’où l’on voit que la fonction u (s, x) 
satisfait à l'équation différentielle 


ou ou 4 , d'u 
Ta trad tUu— 0. (3.8.34) 


Il est de plus évident que pour x = c, et x = c, (lorsque t = 5) 
en vertu de la définition de uw (s,z)on a 


u(s,c) =ut(s, c) = 1. 


CHAPITRE IV 


PROBLÈMES DE PRONOSTIC, DE FILTRAGE 
ET DE RÉGULATION DES PROCESSUS ALÉATOIRES 


$ 1. Problème général de la meilleure approximation. 
Exemples ù 


Dans la majorité des problèmes de pronostic, de filtrage et de 
régulation il y a lieu avant tout de trouver la meilleure approxima- 
tion d’une certaine variable inconnue Ë d’après les valeurs n (4) 
d'un processus aléatoire observé dans un intervalle de temps a < 
<t< b; généralement E = E (t) est la valeur à l'instant t, courant 
ou futur, d’un autre processus aléatoire lié d’une certaine manière 
au processus « observé » n (t), a <t< b. 

Nous avons étudié un problème simple de ce genre dans le $ 4 
du chapitre [ où il y avait lieu de trouver la meilleure approximation 

n 


de la variable £ par des combinaisons linéaires de la forme Ÿ c,14, 
où nr, # = 1, 2, ..., n, sont des variables données. I] s'agissait 


n 
notamment de trouver la grandeur Ë — © cn, telle que 


k=1 
n 
IÈ—É=minfE À can ||. (4.1.1) 
(TR R=1 
Comme nous l’avons déjà mentionné, si l’on introduit un espace 


linéaire H à (n + 1) dimensions de toutes les variables n = Ÿ cum: 


(où no = Ë et co, . .., © sont des coefficients réels quelconques) 
de produit scalaire 
Mis N2) = M (mien) (4.1.2) 
et de mesure 
Im—nl=VMu-n}, (4.1.3) 


n 
la grandeur Ë — Ÿ cn, satisfaisant à la condition (4.1.1) désigne 
k=1 


du point de vue géométrique la base de la perpendiculaire abaissée 
du point & € À sur le sous-espace L de toutes les variables n = 


nt 


A æ . Cd . e 
= à Cxns et se trouve déterminée d’une manière univoque par la 


16* 
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condition d’orthogonälité de la différence £ — Ë au sous-espace L, 
soit : 
Œ—É,n)=0, nEZ, (4.1.4) 


ce qui équivaut au système d'équations linéaires par rapport à 
Ci, + - +, Cn Suivant : 
n 


2 Ch (M4; Ni) = (Ë, Ni)» . ] = 1, ss N. (4.1.5) 


Considérons le problème général de l’approximation de la variable 
examinée E par les variables n d’un certain ensemble Z qui est un 
hyperplan, ce qui signifie que pour un élément quelconque n, € L 
l’ensemble des variables À = n — n,, n € L, forme un espace li- 
néaire, c’est-à-dire qu'avec À, et À, quelconques il contient égale- 
ment leur combinaison linéaire c, A, + c.A, (où c;, c, sont des coef- 

ficients réels quelconques). 


Nous dirons que È€ L est la meil- 
leure approximation de E si 


E—É= min En. (4.1.6) 
ne L 


Lemme de la perpendiculaire. La 
condition (4.1.6) équivaut à 
pour n € L grelconque. (4.1.7) 


Fig. 25. Avant de démontrer cette affirma- 
tion nous allons donner une interpréta- 
tion géométrique à la relation (4.1.7). Si l’on désigne par 
L l'espace linéaire de tous les éléments n — € n € Z, la relation 
(4.1.7) signifie que le produit scalaire des éléments E — £ et À = 
= n — Ë est nul pour tous les À € L, en d’autres termes la diffé- 
rence E — Ë est perpendiculaire à l'espace L (fig. 25). 
La grandeur Ë est appelée projection de £ sur l’hyperplan L et 
la différence £ — Ë, perpendiculaire (abaissée du point Ë). 
Notons également que dans le cas où l’hyperplan L est lui-même 
un espace linéaire (L — L), la condition (4.1.7) équivaut à la condi- 
tion (4.1.4). 
Démonstration du lemme. Soit É EL la meilleure 
approximation de £. De toute évidence on a 


IE—ËI = minllE—Ë6—A I, 
où le minimum est pris sur toutes les différences À = n — Ë, n EL. 
L'ensemble de ces différences formant un espace linéaire L, en plus 
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de l'élément A, L contient également en particulier l'élément AA, 
où À est un nombre réel. Er fixant un À -- 0 quelconque et en posant 


A? =|I|IE—ËF B=—(E—EÉ A), C=IA TP, 
on a alors 
min [|[E—É—ÀA | = min (42 2BÀ + 220?) = A°. 
À À 


La forme quadratique A° + 2BÀ + ÀC* admettant un minimum 
pour À = 0, le coefficient B est égal à zéro, donc la condition (4.1.7) 
se trouve vérifiée. Inversement, si cette condition est remplie, pour 
une variable quelconque nELona & 


LE — ni = 1 — #8) — (n — 6) I = IE — Ë IP + 
+2(E—E, n—6)+ln—EË IE = 
= NE—ÉÉ+In—-ËP>IE—E I, 
ce qui prouve que Ë est la meilleure approximation de £. Le lemme 
se trouve ainsi démontré. 


Notons que la grandeur £ € L satisfaisant à la condition (4.1.7) 


(et donc également à (4.1.6)) est unique. En effet, si Ë:, Ë. satisfont 
aux relations 


Œ— É, n— 4%) 0,  (E—É, n — És) = 0 
pour tous les n € Z, on a en particulier 
(£—É:, Es — 81) = 0, (E—Ée, Êe —Ë1) = 0 
et en prenant la différence de ces expressions on obtient || Ë, — E, || = 
— 0, c'est-a-dire E, — Ex. 
Ci-dessus nous avons vu comment on peut trouver la meilleure 
approximation (linéaire) de la grandeur £ par des combinaisons 
n 
linéaires Ÿ, cynx de quelques variables données n,, # = 1, ...,n 
k--1 


(voir (4.1.1)-(4.1.5)). On peut se poser la question de savoir s'il 

existe une approximation absolument meilleure Ë = @o (m1, - . … Nn) 

satisfaisant à la condition (4.1.6) dans laquelle le minimum est 

pris sur tous les n = @ (n:, .- .- ., 1.) possibles, fonctions des n,, . .. 
-., Mn donnés. 


Théorème. L'approxzimation absolument la meilleure de la gran- 
deur Ë par des variables de la forme n = @ (n:, . . ., nn) est donnée 


par la formule | | 
E = M (8 ln, -.., mn), (4.1.8) 
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où M(E In, --., nn) désigne l'espérance mathématique condition- 
nelle de E en laissant fires n,, . .., Mn. 


Démonstration. Il est évident que l’ensemble Z de 
toutes les variables de la forme n = (m1. . .., n.) telles que 
In If = Mn <'o est un espace linéaire. Comme ME*°< , 
à cet espace appartient également la grandeur Ë figurant dans (4.1.8) 
qui est une fonction déterminée des variables n,, . .., n, : 

h Ë — Po (Mir : + +» Mn) EL, 
E° — [M (E RU 9 Mn)F < M (E° RTE ._. .? Nn) 


ME? SMIM(E | mx . .., n)] = ME? < 00. 


Pour démontrer que Ë = @o (mi, - :., n) est l'approximation 
absolument la meilleure de Ë il suffit de vérifier la relation (4.1.7) 
qui dans notre cas signifie que 


M [(E — E)- (M2 1 Mn)] = 0 
pour tout œ (mn, - --, nn) € Z. Mais pour n,, ..., nm. fixes 


M I(E — Ë)-œ (mn.  . Nn) | M: + +.) Mn = . 
— P (M: +. Mn) [M (IL -..s Mn) — El +0, 


et 


par conséquent 


M {CE — Ë)-p (mn - - + Mn)} = 
= M {MI(E — Ë)-p (mm, - - ., nn) Inn + +, Ml} = 0. 
Le théorème se trouve ainsi démontré. | 


Exemple (problème d'un groupe d'appareils). Soient n 
appareils destinés à la mesure d'une certaine grandeur inconnue a. 
Chaque appareil donnant une erreur de mesure aléatoire, sa 
lecture est alors X, — a + A, au lieu de la valeur réelle 
a(k = 0,..., n —1). Le problème est de réunir ces nr appareils 
en un ensemble de telle sorte que les indications À = a + À de 
l'appareil réuni soient entachées d'erreur minimale || À || = min. 

Il est clair que pour les opérations sur les erreurs de mesure 
Ay, --., An il faut en premier lieu exclure des données de mesure 
X1, ..., X, la grandeur (inconnue) a. A cet effet on peut passer 
aux différences 


X, — Xo = Ar — Ao = Eh k=1Â,...,n— 1, 
puis essayer de trouver la meilleure approximation pour l'erreur 


inconnue A, (= Es) d’après les valeurs connues E;, .. 
A partir de cette meilleure approximation 


À, — Po (Ez, ._ En -1) — Po (X1 — Xo: 7) Xn-1 — X 0) 


° En -l° 
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on peut réaliser l’« appareil réuni » de telle sorte que sa lecture soit 
X = Xo — Po (Xi — Xos - - +» Ân-1 — Ào); 
et l'erreur À = À — a sera 
À = A9 — Po (E1s + + +» En 1). 


Il est naturel de supposer que les erreurs AÀ,, A,, ..., An 
des différents appareils sont des variables aléatoires indépendantes. 
Nous allons croire qu’elles ont même distribution (de valeur moyenne 
nulle): La matrice de corrélation {R,,} des variables Eo Eu 

» En est alors 


Roo — MA; — 63, Rh0 — —0*, Rir — 20°, 
k=1,...,n — 1; 
R,y=0,k=Æj; k,j=1,...,n — 1. 


La meilleure approximation linéaire s’obtient à partir des équa- 
tions (4.1.5), on a 


n— 1 
— — S = D LXo— X x], 
Rk=1 k=—1 


l'erreur correspondante de l’e appareil réuni » étant alors 

{ n— 1 ; ñn 

A=A—— > [Ao— As] = —- >» x. 
k=1 k=1 
L'« appareil réuni » correspondant peut être réalisé de la manière 
suivante : 
n n 
X =— D X x. 
k= 1 


Supposons maintenant que les erreurs des appareils constituant 
notre groupe soient uniformément réparties (sur un certain segment 
[—d, d)). Cherchons l’approximation absolument la meilleure 


Po (E:, ._ En 1) — M (A | Er ._ .) En 1): 


La densité de probabilité conjointe des variables initiales A,, ... 
.. An est 


Ph, ..., An=1 (Yo 7 Yn-1) = 
pour —d<yr<d, k—0,..., n—1, 


O0 dans le cas contraire. 
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Par conséquent, la densité de probabilité conjointe des variables 

Egr + - +» En-1 liées à À,, ..., An par la transformation Ë, = 

= À,, Er = Ag — A, k = 1,..., n — 1, est donnée par 

TE US pour a< To <B, 

Po, + .., En=1 (To: ..s Tn-1) = 
O0 dans le cas contraire, 


a = max (—d, —d—2z,,..., —d— z2,), 

B = mind, d—zx,, ..., d—zx,), 
car le jacobien de la transformation mentionnée est égal à 1 et 
l'inégalité à« < zx,  B signifie exactement que les valeurs corres- 
pondantes Yo, - -., Yn_1 Se trouvent dans l'intervalle —d < y, < 
<d, k=0,..., nr — 1. La densité de probabilité des variables 
Es - + +, En-1 Vaut 
Pi, ..., En-1 (x: ..) Tn-1) — 
Pa pour a<$ 
(24)" ’ 

O pour «>, 


de sorte que pour la densité de probabilité conditionnelle 
Pto (Zo | Tir + + > Tn1) On obtient l'expression suivante: 


O0 
— [ Po, TR c.., En=1 (ro; CAE ...) Tn-1) dro = 
—œ0 


— pour a <B, 
P&o (To| Zi +, Tn-1) = 
O0 pour a >$. 
Pour la fonction cherchée @, (x, . . ., T1) on trouve finalement 
Po (Lis --., Tn-1) = | LoPz0 (Lo Lis ++ Tn-1) do = a . 


—œ 


Il est facile de voir que l’« appareil réuni » optimal doit donner 
la lecture 
X — Xe —+- X* 


+ L 


où X, et X* sont la plus petite et la plus grande valeurs des indi- 
cations X,,..., Xh-1 des appareils du groupe (X étant la demi-somme 
des valeurs extrêmes). 

En effet, comme il est facile de le voir, 


a = —d—(X, — Xo), B = d—(X* — Xo) 
et 
X,+X* 


) 


— 


2 Xe gen 22 En) = Xo— LH 
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« 


ou 
X, = min(Xo, ... Xn), X* = max (Xe, ..., Xa). 


Il est intéressant de comparer les erreurs correspondantes 


[45 a et 8—]+ (A, + 4°) 
R=0 


pour la meilleure approximation linéaire et l’approximation absolu- 
ment la meilleure ; on a ici 
A, = min(A,,..., An), A*= max (A,,...,' A). 
En posant pour fixer les idées d = !/, on obtient 
1/2 
Ê — — z° dr = 


n 128 
— 1/2 


Puis, compte tenu de 
A, = À;, A = À; pour A,< AS A, (k—=0,..., n — 1), 


OD a 
1/2 1/2 


FFM +) = à | | Gi + x 


y y h 1/2 1/2 v1 y 

X | ... (age dm tnt | | [vo + y) duo 
V; VU; —1/2 Yo bo Vo 
n—2 fois 


d …: 1 
CL TETE 


Dans notre exemple pour x grand l’approximation absolument 
la meilleure est nettement préférable à la meilleure approximation 
linéaire. 

$ 2. Pronostic et filtrage des processus 
aléatoires stationnaires 


1. Problème de pronostic linéaire. Soit & (£{) un processus station- 
naire dans le sens général admettant la représentation spectrale 


EG | 4 () (4.2.1) 


et de densité spectrale f (A). Désignons par H,_.,:, l’ensemble de 
toutes les grandeurs 


es) 


1 = | (À) dD (à), (4.2.2) 


— œ 
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où (À) fait partie de l’espace correspondant L,_s.?, (f) de toutes 


les fonctions œ (À), | | p (@) [ff (À) dA qui sont soit de la forme 


œ (À) — Ÿ ent (où #,, ..., t, 1), soit les limites des fonctions 


de ce type (autrement dit, H,_,:, est l’espace des variables qui 
n 


sont soit des combinaisons linéaires n— © c.ë (4,) des valeurs 
k=1 


du processus stationnaire envisagé aux instants #,, ..., {1 <t, 
soit les limites en moyenne quadratique de ces combinaisons linéaires, 
voir p. 2 du $ ÿ?). 

Le problème de pronostic linéaire consiste à trouver la meilleure 
approximation de la valeur « future » & (£ + rt), t >> 0, du proces- 
sus Ë (it) d’après les valeurs n € H,_+, 1. 

Nous allons résoudre ce problème dans le cas où la densité spectra- 
le est une fonction rationnelle de À et peut s’écrire comme suit *): 


P (à) [° 
fO= LUE, — 00 LÀ < 00, (4.2.3) 


où les polynômes P (z) et Q (z) ont des coefficients réels, toutes 
leurs racines se trouvent dans le demi-plan à gauche Re z < 0 de 
la variable complexe z et le polynôme Q (z) n’a pas de racines multi- 
ples : 


Q (2) = go (2 — qu) +. + (2 — Qn). (4.2.4) 


Nous allons pour l'instant supposer que { = 0. Simplifions nos 
désignations posant Æ, = H(_«, mp €t Lo = Li-, ss U). Cherchons 


la fonction œ, (i4) € L, définissant la meilleure approximation E 
de la valeur future E (t) comme suit: 


Ë— | Po (iÀ) d® (À). (4.2.5) 


La condition générale (4.1.7) 
Œ(T)—Ë, 1) =0, nEL, (4.2.6). 


déterminant d’une manière univoque la meilleure approximation E 
équivaut dans notre cas à 


(E(t)—Ë, Et) =0 pour tL0:; (4.2.7) 


*) Notons que l'expression (4.2.3) est la forme générale de la densité spec- 
trale rationnelle. 
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en effet, l'égalité (4.2.7) entraîne (4.2.6) pour toutes les combinaisons 
linéaires n = > c,Ë (t:) dont on peut passer à des variables quel- 
L 


conques n € ZL par un passage à la limite. 
Du point de vue analytique la condition (4.2.7) signifie que 


À eiñt [ets — pe (52) f()dk=0 pour t&0, (4.2.8) 


c'est-à-dire que la transformée de Fourier de la fonction 
d (à) = Leïkt — po (iA)] f (À) (4.2.9) 
est nulle sur le demi-axe négatif t < 0. 


Pour trouver la fonction @, (iÀ) à partir de la condition (4.2.8) 
nous aurons besoin des propositions suivantes. 


Lemme 1. Pour une fonction Ÿ (À) d'une variable complexe, analy- 
tique dans le demi-plan supérieur Im À > 0 et y décroissant pour 


Fig. 26. 


À — co, de sorte que | Q)|LCIA | Et, où e>0,0ona 
| eihp(à) di. —0 pour t<0. (4.2.10) 
Démonstration. Pour une fonction analytique dans le 
demi-plan supérieur et (À), t < 0, l'intégrale à e‘khp (À) dA prise 
sur le contour limité par le segment [—R, R] de l’axe réel et la demi- 
circonférence l de rayon R (fig. 26) est en vertu du théorème de 


Cauchy égale à zéro. 
Pour À —> oo on a évidemment 


CET (À) dA < max |[ÿ(A)|aR<CIRI|-E—0, 
s |A 1=R 
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donc pour {£<0 quelconque 


co R ° 
| etp(A)di= lim | éxp(h)dà = lim & exp (À) dà = 0 
— 00 R- 00 _—R R- 


ce qu'il fallait démontrer. 


Lemme 2. La fonction rationnelle 
n—i 
à an (à)* 
Po (A) = = — , (4.2.11) 


dont toutes les racines du dénominateur, c'est-à-dire du polynôme 
P (z) de degré m, se trouvent dans le demi-plan à gauche Re z < 0 
de la variable complexe, peut s'écrire 
n—-m— 1 co 
Poth)= D (ia) + | ete (t) dt, (4.2.12) 


R=—0 


où c(t) est une fonction continue intégrable. 
1 


! n—-m 
Démonstration. Désignons par D c,(iA)* le poly- 


— 


Ÿ 


nôme obtenu par division de > a, (ik)' par P (ià) et soit P, (2) 
= 0 


le reste correspondant. Soit ensuite la fraction P, (iA)/P (ik) repré- 
sentable comme une combinaison linéaire de « fractions simples » 
de la forme 1/(iÀ — p}“, où p=a+ ip, a < 0, est une racine du 
polynôme P (2), le degré k n'étant pas supérieur à la multiplicité 
de cette racine. Comme 


1 COR a 
me = | nr ent a, 


il est facile de voir que toute combinaison linéaire des expres- 
sions de la forme 1/(i — p}* peut être représentée par l'intégrale 
| e”it c (t) dt, où c (t) est une combinaison linéaire des fonctions 
0 

(— 1)* th-1 pt 0 


GNT € ’ LIL oc. 


Le lemme se trouve ainsi démontré. 


Nous allons chercher la fonction œ, (iÀ) comme une expression 
du type (4.2.11), en définissant les coefficients ax, 4 = 0, ..., n—1, 
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de telle sorte que la fonction 1 (À) liée à , (iÀ) par l'égalité (4.2.9) 
soit analytique dans le demi-plan supérieur de la variable complexe 
Im À > (. 


La densité spectrale f (À) = TE ayant pour pôles dans le 
demi-plan supérieur les racines —ig,, ..., —iq, du polynôme 
Q (id), quels que soient les coefficients a,, # = 0, ..., n, la fonc- 
tion 

n— 1 
ep (in) — Say (A) 
DO 
Q (ià) Q(—i) 
sera analytique dans le demi-plan supérieur, à l'exception peut-être 
des pôles simples aux points À = —iq,, . .., —iqn. Si l’on déter- 
mine les coefficients a;, k = 0, ..., nr — 1, à partir du système 


d'équations linéaires 
n— {1 


S'ag=efP(gy, j=1,...,n, (4.2.13) 


Rk=0 


dont le déterminant 


1 Qn Gn..-Qn. 


diffère de zéro pour q,, . .., 4 différents, la fonction correspondante 
4 (À) sera analytique dans le demi-plan supérieur. Comme |# (À) | 
décroît pour | À |—> oo comme | À |”"*”""!, en vertu du lemme 1 la 
transformée de Fourier de 1# (À) s’annule sur le demi-axe négatif 
10. 

La fonction œ, (iÀ) définie par l'égalité (4.2.11) satisfaisant 


évidemment à la condition | | Po (À) [°f (À) dA << oo, en vertu du 


lemme 2 elle admet la représentation (4.2.12), l’on voit immédiate- 
ment que ®, (iÀ) appartient à l’espace Z,. 

En effet, la densité spectrale f (4) décroît pour | À | —> comme 
[A |[-**-7 et les fonctions définies successivement par le passage 
à la limite 
k SAU+R) _ int | 
g@)= lim (A)! = (il)feint, k—0,..., n—m—1, 

h=— 

appartiennent toutes à L, lorsque t < O0 (pour £ = 0 on a œ (à) — 
= (Gi), k = 0,..., n — m — 1); il en est de même des fonctions 
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du type 
00 0 
(À) = | e-c(t) dt = | eiMc(—t) dt, 
(1) — 


où c (t) est une fonction continue et absolument intégrable sur la 
demi-droite 0 < ? << oo (voir p. 2 du $ 7). 

Nous avons ainsi trouvé que la fonction , (iÀ) € L, satisfait 
à la condition (4.2.8) et que la meilleure approximation de la va- 
leur & (+) par les variables n € L, est donc 


00 n-m—i{ 0 
É— | pt)dD(= D EM (0)+ À c(—s)E(s)ds. 
— 00 k=—0 — 00 
Il est facile de vérifier que 
co n—-m— i t 
E(= | épi dD(A)= D cb (#+ À c(t—s)E(s) ds (4.2.14) 
— © hk=0 — 00 


est la meilleure approximation de la valeur future & (£ + +) par 
les variables n € H,_+,:,. Finalement nous arrivons au résultat 
suivant. 


Théorème 1. Za meilleure approximation de E (t ++) par les 
variables n € H,-x.1, est donnée par la formule (4.2.14) où la fonc- 
lion %o(iÀ) est donnée par l'égalité (4.2.11) avec les coefficients 
Ag + - +» An Satisfaisant au système d'équations linéaires (4.2.13). * 


Eft) EE (pl Ëfe) 


Fig. 27. 


Ainsi, le meilleur pronostic linéaire d’un processus aléatoire 
stationnaire E (£), —oo << {<< ©, dans un temps + peut être obtenu 
à l’aide d’un système linéaire de fonction de transfert 


A—1 
Po(p)= D, axp*/P (p). 
k=—0 


2. Filtrage linéaire (estimation de la valeur moyenne). Considé- 
rons un processus aléatoire & = £ (?) du type 


ë (2) = 0 (1) + À (i), (4.2.15) 


6 (£) est une fonction de t (appelée ultérieurement « signal ») 
À (t) un processus aléatoire de moyenne nulle M A (t) = 0 


où 6 
et À 
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(appelé ultérieurement « bruit aléatoire »). Supposons qu'il y ait 
lieu d'isoler un signal 6 = 68 (t) d’un bruit aléatoire À = A (+6), 
plus exactement d’estimer la fonction 68 = 8 (t) d’après la trajectoire 
du processus aléatoire & ({) = 6 ({) + A (1), 41€ T, sur un inter- 
valle T, si les signaux éventuels 6 = 6 (£f) sont de la forme 


m 


8( = À @x04 (4), (4.2.16) 

R=1 
où 60, (4), ..., 0, (t) sont des fonctions données linéairement indé- 
pendantes et les coefficients &,, ..., «, peuvent prendre des 


valeurs réelles quelconques. 
Commençons la résolution de ce problème par l'estimation 
des coefficients inconnus &1, ...,@m dans l'expression (4.2.16). 
Désignons par H (T) l’ensemble de toutes les combinaisons 


linéaires n — à c.ë (tx) et de leurs limites en moyenne quadratique 
À 


n=lim m.q. à cxË(&), ET. 


Nous appellerons les variables n,, . .., 9m € H (T) estimations 
linéaires centrées des coefficients Air + - +» Am Si les valeurs moyen- 
nes Mnx, k# = 1, ..., m, pour tous les @&;, ..., &n possibles 
satisfont à la condition 

Mn, = an, k = 1,..., m. (4.2.17) 


Exemple (estimations des moindres carrés). Supposons que la 
fonction inconnue 6 = 8 (£) et la fonction aléatoire envisagée È = 
— E (t) soient de carré intégrable sur l'intervalle T = [a, bl. Pour 
des fonctions quelconques z, = z, (ft) et x, = zx, (t) de ce type posons 


b 
CREDE | Ti (t) Ze (t) dt. 


a 


D’après la trajectoire connue E (f), a < t < b, déterminons les 
variables m1, .- .., Nm à partir de la condition 


b n R . 
| [ E (9 — » Na 0% OI d= min | [E (t) — > YrOh «) far, 
a k—! um k=! 


do ..., 


où le minimum est pris sur tous les y,, ..., y réels. Il est ici 
question du minimum d'une forme quadratique non négative, soit 


à EL (0%, 0;) 


RQuu +. ÿm) =, E)—2 2 yn (Ou, E) + 


R, 
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des variables (y,, ..., mn). Ce minimum est atteint au point 
(2: .. Nm)» où 


a m 
2 R(m ees Mm)= —2[ (64, +3 ny (8, 0;) | =0, 
k—1,...,m, 


ce qui nous donne un système d'équations linéaires en m9, . .., Nm: 
2 n (O2, 05) =(È, Ou), k—=1, ..., m. (4.2.18) 
2= 


Pour des fonctions linéairement indépendantes 6, (£), ..., 0, (4) 
la matrice D —{(8,, 8;)} composée des coefficients 


b 
(64,8) = [ 04 ()O;(#) dt, k, j=1,...,m, 
du système d'équations (4.2.18) est régulière et la solution de ce 
système est 
m= à Oni(O;,E), k—1,..., m, (4.2.19) 
2= 


où 04; sont les éléments de la matrice {0,,} inverse de la matrice D. 
Pour une fonction 6;(f) quelconque l'intégrale (0,, E) — 


b 
= | 6, (#) & (ë) dt est la limite en moyenne quadratique des sommes 


a « 
intégrales correspondantes qui sont des combinaisons linéaires de 
la forme D'c4ë (4:). Par conséquent, tous les (6, £) entrant dans 


l'expression (4.2.19) ainsi que les variables n,, . .., 1, appartien- 
nent à l’espace linéaire AH (T). 
De plus, la valeur moyenne ME (f) étant égale à 0 (4) = 


— ÿ «604 (f) on a 
k=1 


b b 
M, 5 =M | 6,()E0@at= | 6, (9 ME (Id 


6, (t) 0 (4) dt —(6;, 8), 


D © 


d’où il vient que les valeurs moyennes 


Mn: = D Ox;(0;, 0), k= 1, .. M, 
Rk=—1 
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s'obtiennent d’après la formule (4.2.19) en y remplaçant E = E (t) 

par 0 — 6 (f). Par conséquent ces valeurs donnent un minimum de 
b m 

l'expression | É (£) — D YrOp (£) F dt; comme pour 86 (t) — 
k=! 


m 
— © œ204 (t) le minimum nul se trouve atteint pour y, = &», 


1 
k = 14,..., m, on en conclut que 
Mnz = &», k =1ÀÂ,..., m. 
Ainsi, les grandeurs n,, . .., nn définies par la formule (4.2.19) 
sont en fait des estimations linéaires centrées des coefficients incon- 
nus Œy, + - -» Em (elles sont généralement appelées estimations des 
moindres carrés). 


re 


Nous dirons que les estimations linéaires centrées &;, . .., Am 
des coefficients «&,, ..., &æ, Sont les meilleures si 


lœr—@xl= min |[ax—n|, k=—1,...,m, (4.2.20) 
neEL} 


où le minimum est pris sur toutes les estimations linéaires centrées n 
pour le coefficient correspondant «;, (dont l’ensemble sera désigné 
par L;). 

Par définition, L, est l’hyperplan (dans l’espace linéaire H (T)) 
de toutes les variables n € À (T) satisfaisant à la condition Mn — 
= &. Donc (voir le lemme de la perpendiculaire, page 244) les 
meilleures estimations centrées a, € L, sont définies d’une manière 
univoque par la condition 


(x — Ans N — x) = 0 pour tous les n E L,, k = 1, ..., m. 
(4.2.21) 
Essayons de décrire d’une manière explicite l’espace Æ (T) et 
les hyperplans L,, k = 1, ..., m, en supposant que dans l’expres- 
sion (4.2.15) À = A (t) est un processus aléatoire stationnaire de 
densité spectrale f (À) admettant la représentation spectrale 


00 


A (t)— | et d®, (à), (4.2.22) 
et la fonction 8 = 6 (4) est la transformée de Fourier de Ô = 8 (A) : 
O(t)= | ei (À) dA, (4.2.23) 


avec de plus 6 (À) satisfaisant à la condition 


| re ao. (4.2.24) 


1/: 17-0521 
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Les formules (4.2.22), (4.2.23) nous permettent de représenter 
le processus aléatoire étudié E ({) — 8 ({) + À (f) par une intégrale 
stochastique 


E (4) = | eikt dO (À) (4.2.25) 
(comparer avec la représentation spectrale (3.7.4)), où 
à 
O (À) = | Ô (A) dA + D, (À) 
est un processus aléatoire à accroissements non corrélés de moyenne 
x 


MO (À) = | 8 (À) dA 
et de densité structurale f (À). 
Tout comme pour les processus stationnaires nous allons envi- 
sager un espace linéaire Æ7 (T) de toutes les variables n représentables 
par l'intégrale stochastique 


n= | @ (À) dO (2), (4.2.26) 


où les fonctions œ (À) appartiennent à l’espace Lr (f) correspondant, 


de plus l'intégrale | œp (À) 8 (À) dA existe (voir p. 2 du $ 6). 


En général, l'existence de l'intégrale | œ (À) 6 (À) GX est une 


condition supplémentaire imposée aux fonctions p (À) € Lr (), mais 
pour les hypothèses faites ci-dessus elle découle directement de la 


condition générale | |P(A) f (A) dA << oo, car 


[ ROEGIE= | |e@)V7 us ja 


PA EE ECS 
<V TT ES 74 [ QE an < 00. 
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Ainsi, l’espace linéaire H (T) est formé par tous les 


1n— | p(A)dO(A),  p(A)ELr(f). 


Rappelons que pour les intégrales stochastiques (4.2.26) on a 


Mn = | PAGE | (4.2.27) 


et 
a — Mn Ne — Mne) = (Qu Pa), (4.2.28) 


où ,, w. sont les fonctions correspondantes de l’espace L- (f) et 


qq À (4) 9) (A) à. 


Considérons les fonctions 
h (4), +.) mn (À) € Lr (P), 


satisfaisant aux équations intégrales *) 


| eh, (A) F(A)dA— 0 (4, 1€T, k—1,..., m. (4.2.29) 


—©œo 


La condition Mn = «; définissant l'hyperplan Z; pour les 


variables n — | (À) dO (à) signifie selon la formule (4.2.27) que 


Î p (A) 6 (A) di = | pA)[ > api (A) | f (A) = 
TT — 00 j=1 
= Daj(p,b}=a (42.30) 
j=1 


pour tous les &;, ..., à, ce qui, ces coefficients étant quelconques, 
est équivalent à la condition suivante: 


{ pour j—=k, 19 31 
(®, Ÿs) = 0 pour ik. (4. ° ) 

*) Notons que de telles fonctions 41, . .., Ÿm existent toujours, de plus 
pour chaque k — 1, m on a une solution unique Ÿ, (À) de l'équation 


(4.2.29) appartenant à l'espace Lr () (à ce sujet voir Y. Rozanov, Processus 
aléatoires stationnaires (en russe), FIZMATGUIZ, 1963, p. 190). 


17% 


260 PROBLÈMES DE PRONOSTIC. DE FILTRAGE ET DE REGULATION (CH. IV 


Nous avons vu que chacun des hyperplans L, (des estimations 
linéaires centrées n = | p (À) dO (À) pour des coefficients inconnus «&;) 


est donné par le système d'équations (4.2.31), où les fonctions ph, (à), . .. 
..…. Pm (À) satisfont aux équations intégrales (4.2.29). 
Revenons à la condition (4.2.21) donnant la meilleure estima- 


tion &, = | Por (à) dD (À) de a; pour chaque k = 1, ..., m. 


En vertu de la formule générale (4.2.28) cette condition pour la 
fonction correspondante œox (À) E L, signifie que 


(Pons P — For) = 0 (4.2.32) 


pour tous les (À) € Lr (f) satisfaisant aux équations (4.2.31). 
Introduisons la matrice D = {d,;} d'éléments 


Co 


das = (as b)= | A): 0) 7 di. (4.2.33) 


Comme pour des fonctions 6, (£), ..., 0, (ft) linéairement indé- 
pendantes les fonctions w#, (À),..., Ÿh (À) définies par les 
équations (4.2.29) sont également linéairement indépendantes, la 
matrice D est régulière et possède donc la matrice inverse 
D”! ={0,;} telle que 


mn 14 pour k —i, 
> Gus = | P 
J=1 


O0 pour kÆ i. 


Montrons que les fonctions cherchées 4 (À) sont 


Po (A) = 2 OrjŸ; (à), k—1Â, ..., m. (4.2.34) 
J— 

En effet, comme toutes les fonctions 1; (4), j — 1, ..., m, 
appartiennent à l’espace L-r (f), les fonctions Por (4), À = 1, . .., m, 
en font partie également. Chacune de ces fonctions satisfait à la 
condition (4.2.31) correspondante, à savoir 


e 
* 


4 pour j =k, 


(Por, Ps) = à One (Ps, Vs) = 2 Grid) -| 0 pour jÆk. 


De plus, pour chaque # = 1, ..., m on a l’égalité (4.2.32), car 
pour toute fonction œ (À) satisfaisant à la condition (4.2.31) on a 


m 


(Pox: P}) = 2 On (Vis P} = Ouk 
2= 
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et simultanément 


m 


(Pons Por) = À OnidijO jn = Onn. 
4, 


Notons que la matrice D! —{0,;} est la matrice de corréla- 
tion des erreurs ax — @n, k = 1, ..., m, des meilleures estima- 
tions des coefficients &;, ..., &Œm, à Savoir 

Onj = (Pons Pos) = M (@x — ax) (œ;y — ay), ki j — 1, ..., m. 
(4.2.35) 
Le résultat obtenu peut être formulé comme suit. 


Théorème 2. Les meilleures estimations linéaires &, ..., am 
des coefficients inconnus œ, ..., &m sont données par l'expression 


ay = | Por (À) dO(X), k—1,...,m, 


où les fonctions por (À), k = Â, ..., m, sont liées par les formules 
(4.2.34) à la solution x (À) € Lr (f), k = 1, ..., m, des équations 
intégrales (4.2.29). 

Notons que parfois il est possible d'estimer sans erreur les coef- 
ficients inconnus ax, k = 1, ..., m* 


Exemple (loi des grands nombres). Soit 
B() = 0<1< oo, 
où «& est une constante inconnue. On a alors 


a = lim m.q. - | E (t) dt. 
ñN—r00 A 
En effet, 


+ fso-e-t Tao 


où pour le processus stationnaire À (f) — | eiMd®D, (À) on a 


n 


1 A (t)dt = ( [+ eiàt dt | dO, (à) = [ 140, (4), 
0 


© — © 


et il est facile de voir que pour 7 —+ oo 


4sin* An 
A°n° 


; ñn : co in _4 o co 
Lfswd-af- | | | ja | f (A) dà +0. 
n in 

0 — 00 oo 

*) Il en sera toujours ainsi lorsque la condition (4.2.24) n'est pas vérifiée. 
Voir par exemple I. Ibrahimov, Y. Rozanov, Processus aléatoires gaussiens 
(en français), éd. « Mir», 1974. 
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$ 3. Espérances mathématiques conditionnelles 
et problèmes de pronostic et de filtrage 


1. Précisions sur les espérances mathématiques condition- 
nelles. Considérons une famille quelconque de variables aléatoires 
n (4), (€ T, dépendant du paramètre £ et une variable aléatoire E 
liée d’une certaine manière aux variables n (4), 4€ T. 

A titre d'exemple on peut imaginer une expérience complexe 
dans laquelle on observe d'abord les variables n (4), 4 € T, puis, 
suivant les valeurs de n ({), { € 7, on effectue une expérience supplé- 
mentaire où l’on observe la variable aléatoire E; autrement dit, 
le « mécanisme du hasard » agit par étapes, c’est-à-dire que d’abord 
les variables n (t), t € T, prennent leurs valeurs en obéissant à une 
certaine distribution des probabilités, puis conditionnellement aux 
valeurs de n (t) prend ses valeurs la variable E. 

Dans ces conditions l'espérance mathématique de £ (nous la 
désignerons par M {£|n}) pour des valeurs données den ({).t€ 7, 
dépend des variables aléatoires n (t), £ € T, et est en ce sens une 
variable aléatoire. L’intuition suggère que la valeur moyenne M E 
pourrait être trouvée en prenant d’abord M {E | n} laissant fixes 
n (4), ET, et en calculant ensuite l'espérance mathématique 


ME =-MIM({E |n)}l. (4.3.1) 


De plus, pour toute variable aléatoire @ (n) déterminée d'une manière 
univoque par les valeurs de n{(t), 4€ T, on doit avoir l'égalité 


M{p(m)'E In} = pm) M{E ln}, (4.3.2) 


car pour n ({), £E T, fixes  (n) est une constante. 

Désignons par ZL l’ensemble de toutes les œ(n) telles que 
M œ° (n) << oo. Supposons qu’à toute valeur fixe de n(t), {€ 7, 
correspond une distribution conditionnelle et que l'espérance matheé- 
matique M {E |n} possède les propriétés (4.3.1) et (4.3.2). 

Considérons la variable €, M E? < co. La variable correspon- 
dante £ — M (E | n) fait partie de L;' car en vertu de l'inégalité 
générale pour les moments on a 


Ë? = [M (E |) SM (E° | n), 
en appliquant à &*° la formule (4.3.1) on obtient 
M IM (E° |n)l = M £° 


et par conséquent M Et < M ë° << co. En vertu de la formule (4.3.2) 
on aM{ (n)-E |n} = p (n)-Ë, de sorte que l'inégalité (4.3.1) pour 
o (n) ë donne 


M [M {œ (n)-E In}l = Mo (n)-ël = (p (n), E) 
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et simultanément 
M [M { (n)'E [n}l = Ml (n)-Ël = ( (n), Ë), 


d'où l’on tire que 


(& — E, p(n)) = 0 pour tous les op (n) € L. (4.3.3) 


Mais nous avons montré au $ 1 qu'il existe une seule grandeur ÉEL 
satisfaisant à la condition (4.3.3), c'est-à-dire que £ — M {E |n} 
est du point de vue géométrique la projection de la variable Ë sur l’espace 
linéaire L de toutes les q (n), M æ° (n) << ©, qui sont des fonctions 
des n (t), ‘ET. 


En partant des espérances mathématiques conditionnelles on 
peut trouver la distribution conditionnelle correspondante, car 


P{z <E<z”"In} = M {p (#6) In}, (4.3.4) 
où la fonction œ (x) est 
4 pour z'<r<zx”, 
p()={ O0 pour les autres x. 


E xemple. Soient E et n des variables aléatoires discrètes 
dont la distribution conjointe est P:, (x, y), —o0 < x, y < oo. 
Cherchons la distribution conditionnelle P,; (x | n) de & pour n fixe. 

L’espérance mathématique de la variable aléatoire  (Ë), fonction 
de Ë, conditionnellement à la distribution P: (x | n) pour n fixe est 


M{9Œ)1n}= 2 (x) P(z|n). 


Pour une fonction bornée = 4 (y) on a 


M { (E)  (n) In} = 2 @ (x) 4 (n) Pr (1m). 


En écrivant les espérances mathématiques des membres de gauche 
et de droite on obtient d’un côté 


MM {9 (6) ® (n) |n}l = Mo (6) Ÿ (n) = 2 à p(r) (y) Pan (2; y), 


et de l’autre 


MIM{p E) + (n) In} =M CZ @ () + (n) Ps (x 1n)l = 


— 2 2 p(x)v() Pa (z1 y) Pn (4) 
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(où P, (y) est la distribution de n), ce qui donne l'égalité suivante: 
à 2 (x) vb) Ps (19) Pa(y) = À 2 p(x) b (y) Pan (x, y). 


D'où en posant 


À pour z=2%xo, 

p@)= 0 pour zx; 
1 pour y= Yo; 

= 0 pour y <y 


pour Zo, Yo quelconques on a 
P g (Zo | Yo) Pn (Yo) = P En (Zo: Yo)- 
Ainsi, pour des valeurs quelconques y que prend la variable n 
avec une probabilité positive on a 


Pyn (x, y) 
P GN= TE (4.3.5) 


(comparer avec (1.3.16)). 
Exemple. Soit n une variable aléatoire discrète de distri- 


bution P, (y). Supposons que pour chaque n fixe la variable & admet- 
te la densité de probabilité conditionnelle p: (x |n). Pour 


À pour z'<7z<1”, 
pG)= O0 pour zz',z>zx; 
1 pour U = Yo) 

vu = | 0 pour yÆYo 


on a 


MM {b (n) 9) |n}]-=M [ven Ÿ rs teimde]= 


=> [vw Î pe (x 11) dz | Pa (u) = j pe (x | vo) dr Pa (yo). 


V 
Mais pour y, quelconque la formule (4.3.1), appliquée à la grandeur 
4 (n) p (£), donne en même temps 


M [M {p (n) p (6) In}l = M + (n) y (#) = 
=P{r <E<zr", n = Yo}; 
de sorte que finalement on obtient 
x” 
P{r'GE<r,n=y}= | prtziy)dzPaly) (4.3.6) 
pour tous les x’, x” et y. ° 
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Exemple. Soit E une variable aléatoire discrète de distri- 
bution P: (x), —oo << x << 00, et soit la variable aléatoire n admet- 
tant pour chaque valeur donnée de Ë une densité de probabilité 
Pn (Y |Ë), —oo << y << co. Trouvons la distribution conjointe de 
ces variables et la distribution conditionnelle P}; (x |n) de È par 
rapport à n. 

La probabilité de l'événement {y < n < y”} sous la condition 
E = x est ù 

Ua 


PYy<n<y'Ii=z}= | Pa (y| x) dy. 
D’après la formule (4.3.6) ‘ 


y” 
. PE=z, y <n<y}=P;(x) | Pa (yl2) dy, 
ÿ 


et par conséquent la distribution conjointe est donnée par 


w x 
P{r'gics, y <n<y}= | [5 P:(o paul) | dy. 
Il en découle en particulier Fo 
y” 00 
P{y<n<y}= | [D Pr(opn(u| 2) | dy, 
y”  — 
et l’on voit que la densité de probabilité de n est 


Pn (y) = ÿ Pn (y 1x) Pa (x). 


Montrofñs que la distribution conditionnelle P.(x | y) de la 
variable aléatoire £ en fixant mn —=#7y est donnée par la 
formule de Bayes: 

Pa (z|y) = P (0) ME. (4.3.7) 
Pn (4) 


En effet, la formule (4.3.7) donne une distribution par rapport 
à laquelle la valeur moyenne 


M{pŒ)In}=2 px) Ps (cn) 
des variables du type œ (£) satisfait à la condition (4.3.1), soit: 


Oo 


MIM{P®In}= | M{9@)1u} pa (y) dy = 


= » p(x) Pe (x) | | Pa(ylo dy |= > p(zx) Ps (x) = Mo ©), 


18—0521 
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ainsi qu’à la condition (4.3.2), et nous savons que ces conditions 
déterminent d’une manière univoque les grandeurs M {œ (£) |n}; 
dans leur ensemble (pour différentes œ (E)) les valeurs moyennes 
M {œo (£) In} déterminent d’une manière univoque la distribution 
correspondante P,4 (x | n) (par exemple M {@ (£) |n} = Ps: | n) 
pour la fonction (x) égale à 1 lorsque x = zx, et à zéro pour les 
autres x). 

Exemple. Soient E et n des variables aléatoires de densité 
de probabilité conjointe pzn (x, y). 

Montrons que la densité de probabilité conditionnelle p: (x | r) 
de E par rapport à n est 


Pan (x; y) 
P(rlN= ET, —o0<z< 0, (4.3.8) 


Pn (y) = | Pin (Z, Y) dx, — oo Ly<oo, 


est la densité de probabilité de n (comparer avec (1.3.17)). 

En effet, l’espérance mathématique d’une variable du type 
 (£) conditionnellement à une distribution de densité de proba- 
bilité indiquée p: (x | n), soit: 

M{pŒ@)in}= | p(x) m(z1n) dr, 


—©œ 


satisfait à la condition (4.3.1), à savoir 


MIM{Œ)n1= À Lo (x) ps (1 9) da] pr (y) dy = 


O0 C0 Le 


= [o@[T pntr,pdv]dr= À (2) pe (x) dr = Mo), 


de sorte que M {p (£) |n} donne réellement l'espérance mathéma- 
tique conditionnelle des variables o (£) par rapport à n. Mais dans 
l’ensemble (pour différents y (£)) les valeurs moyennes M {o (£) |n} 
déterminent d'une manière univoque la distribution correspondante, 
en particulier, en vertu de la formule (4.3.4) on a | 


n 
P{r<igrin}= (| p(zIn) dr, 


et ainsi la fonction px (t | n), —oo << zx << oo, donnée par l'égalité 
(4.3.8) est la densité de probabilité conditionnelle de £ pour n donné. 
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Notons que pour la densité de probabilité conditionnelle p, (y| E), 
on a une formule analogue à (4.3.8) : de plus a lieu l'égalité suivante 
(comparer avec la formule de Bayes (4.3.7)): 


UE Pe (x). (4.3.9) 


2. Les probabilités a posteriori dans certains problèmes de 
pronostic et de filtrage. Comme nous l'avons déjà vu, les propriétés 
fondamentales des espérances mathématiques exprimées par les 
relations (4.3.1) et (4.3.2) permettent de donner l'interprétation 
géométrique suivante à la moyenne conditionnelle & = M (& |n) 
de la variable £, M E° < ©, par rapport aux variables n (t),1 € T: 
É—M (E | n) est La projection de E sur l’espace L de toutes les grandeurs 
du type @ (n), fonctions des valeurs de n (t), t € T. De plus, ë donne 
la meilleure approximation de E par des fonctions œ (n) € L: 


IÈ—6811= min||Ë—®(n) ||. 
œ (n) 


Ps (x|y) — 


Nous allons envisager le problème d'estimation de la valeur 
de £ d’après celles de n (t), { € T, lorsque le nombre de valeurs 
possibles de E est fini. Pour concrétiser le problème on peut supposer 
par exemple que Ë décrit l’état d’un système dont on ne peut juger 
que d’après les observations d’un certain processus aléatoire n — 
= n (4). 

Des exemples simples montrent qu'en général l’espérance mathé- 
- matique M (£ | n) ne prend pas obligatoirement l’une des valeurs 
possibles de E (par exemple E = 0, 1, ..., N), aussi la valeur 
M (£]n) ne permet-elle pas de dire dans lequel des états éventuels 

, 4, ..., N se trouve le système. 

Nous dirons que œ, (n) € ZL est la meilleure estimation de l'état 

inconnu Ë si la probabilité d'erreur P {q,(n) 6} est minimale: 


P {Po (n) < £} — min P{p(n) ÆE}. (4.3.10) 


Il est clair que pour trouver la meilleure estimation il suffit de se 
limiter aux grandeurs œ (n) € Z dont les valeurs possibles sont les 
mêmes que celles de £ (dans notre exemple ce sont 0, 1, ..., N). 

En supposant que, tout comme précédemment, la distribution 
conditionnelle *) P,(k |n), k —0,..., N, de la variable E 
existe pour des valeurs quelconques fixes de n (1), t € T, posons 


E —= ®o (n) égale à celle des valeurs k = 0, 1, ..., N pour laquelle 
la probabilité P.(k | n) est maximale, soit 
Ps (El) = max Ps (k]n). (4.3.11) 


*) Les probabilités P, (4 | n) sont parfois appelées probabilités a posteriori 
(apres l’« observation » de n). 


18* 
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Théorème. La grandeur E = (n) satisfaisant à la condition 
(4.3.11) est la meilleure estimation de E. 


Démonstration. Introduisons les fonctions #4 (x), À = 0, 
1, ..., N, égales à 1 pour zx = k et à zéro pour les autres valeurs 
de z. Choisissons l’une quelconque des fonctions @ = œ (n) prenant 
l'une des valeurs 0, 1, ..., N. Il est facile de voir que 


P {o(n) HE} = ME = MIM(E |n)}, 


N 
où & = 7 D lan (E) — xx (p)Ï* est égale à 1 pour @ (n) ÆE et à 


k=—0 
zéro dans les autres cas (pour @ (n) = £). Pour des valeurs fixes de 
n @),t€T, la grandeur #: () est une constante et M {4 (E) |n} = 
— P,(k |n), de sorte que 
N 


MEIm=+ 3, M4 ( —% (PIE | n} = 
R=:0 
& 


= + S MAP E)— Pr EME In} ++ D [Ps ET n) —24 (p)F, 


k=0 R=0 
où pour @(n)=jona 


N N 
FD I Pa (&]n) —X:(p)F + > Pa (En) — Ps (in ++: 
2 


N 
Posons Ëo = _ D [xx (E) — Xx (Do) et considérons la différence 
hk=0 


M @ In) —M (Go ln) = PeGo ln) — P3G In 


OÙ jo = Po (n) est la valeur pour laquelle la probabilité P, G |n) 
est maximale (voir (4.3.11)). Il est clair que pour j = (n) quel- 


conque 
M (6 In) —M (Go In) =M{E6— ln} >0 
et par conséquent 
ME — ME =M(Ë— 6) =MIM{E—&1n}2>0 
c'est-à-dire 
P {op (n) ÆË} > P{po (n) ÆË}, 
ce qu'il fallait démontrer. 


Exemple (problème des déréglages spontanés). Supposons que 
nous voulions connaître l’état d’un système à l'instant courant # 
dont nous aurions pu juger avec certitude d’après le « signal » 0 (£), 
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caractérisant le passage du système d’un état à l’autre, mais en 
fait on « observe » seulement le processus £ = E (4), t > 0, tel que 


dE (t) = 6 (t) dt + dn (t), (4.3.12) 


où dans la différentielle stochastique dE (t) figure comme toujours 
le terme n (t) décrivant le mouvement brownien. D'après la trajec- 
toire E (s), s < t, il y a lieu d'estimer l’état du système à l'instant 
courant {, plus exactement, d’estimer la variable 8 (?). 

Pour plus de simplicité nous allons supposer qu’à l'instant 
initial le système se trouve à l’état O et qu'avec le temps son état 
peut changer et devenir, par exemple, 1 (le changement d'état peut 
témoigner d’un déréglage ou d’une panne). 

Nous allons supposer que 


(= | 


où t, instant de transition de O0 à 1, est une variable aléatoire à 
distribution exponentielle 


P{r>t} = et, 


Comme nous l’avons montré ci-dessus, la meilleure estimation 
de la valeur inconnue 86 (f) d’après les valeurs E (s), s < £ (dont 
l’ensemble sera ici désigné par E:), est donnée par les probabilités 
a posteriori 


0 pour £1<<7T, 
4 pour >, 


la) =n(), a () =1— (0), 


nt) =P4{8( =0]|E}. 


Supposons que l’on observe le processus aléatoire £ — E (£) à des 
instants discrets { multiples de At, étudions alors la variation dans 
le temps des probabilités a posteriori x (t). 

Considérons préalablement la densité de probabilité condition- 
nelle p {x | (t) = 0, &:} de la variable E (ft + At) sachant que 
6 (4) = 0 et en laissant fixe la trajectoire E, = {E (s), s <t}. En 
vertu de la formule (4.3.12) on a 

t+At 


E(£+ At) —E (+) + | O(s) ds + An(t), 
t 


« 


ou 


où An (é) est une variable gaussienne indépendante de valeur moyen- 
ne nulle et de variance At. Pour une fonction 8 (s),t<s<t + At, 


fixe la densité cherchée est 
t+At 


as SP {27 [50 8()ds|'}, (4.3.13) 
— ©O<TTI<< OO, 
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et comme 


t+At N—u pour T—it=u, 0<u<At, 


0 (s) ds — 

(5) { O0 pour T—t> At, 
et 0 (£) — O0 par hypothèse, la variable aléatoire t — £ est distribuée 
sur le demi-axe u > 0 avec une densité de probabilité égale à Àe-?". 
On obtient finalement 


p{rl0(t)=0,E}-- 


At 
= | = {Hs —E()— (At) } heu du + 
0 


ES 2 | b—xAt 
. + V2rat EXP { JAt [z ë ()] } s ° 
Pour 6 (#4) = 0, 6 (4 + At) = O0 (c’est-à-dire qu’en fait pour 8 (s) = 
= 0, 1 Ls<t + At) l'expression (4.3.13) nous donne la densité 
de probabilité conditionnelle 


p{x|0(=0, &, DGA) 0}= exp { — ste —È (HE) - 


Il est facile de vérifier que l’on a l'égalité suivante analogue 
à la formule de Bayes (4.3.7): 


P{0(t+A1)=010(1) —0, Er, E(t+Ar)}— 
: : : pië(t+At)]0(t)—0.E£r, 8 (t-- At) —0} 
= P{8(t+ At) —018() =0,E} —=—— P{E(U-+ A1) [0 (4) —0, E} | 
(4.314) 


» 


ou 


p{E(+At)10(#)—0, Br} _ 
PIEU-+ A1) [0()—0, &, 0 (+ A1) — 0} 


At 
— | exp { jar I2AE (8) (At —u) — (At—u}?] } heu du + erêt — 
0 


= [1 +o(1)} A++ eat = 1 + o (Ai); 


la grandeur o (At) dépendant de l'accroissement AË (t) = E (t+ At) — 
— E (t) est un infiniment petit d'ordre plus élevé que At pour At—+ 0 
(lorsque AË (4) — 0). Comme P {8 (4 + At) = 0 18 (4) — 0, Ek:} 
donne la probabilité pour le système de rester à l’état O durant 
l'intervalle de temps At (cette probabilité est égale à e-À4t), l'égalité 
(4.3.14) conduit alors à la relation suivante: 


P{0(4t+ At) =01)68() —=0, Era} = 1 — AAt + o (At), 
où la grandeur o (At) a le même sens que précédemment. 
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Puis, d’une manière analogue à (4.3.14), on obtient l'égalité 
P{8(4)=0[&, E(t+At)}=P {0(1) = 0[E} x 
X p {È (t+ At)10(1)=0, Ge (4.3.15) 


pië(t+At)l&r} 
Il est clair que 


p{E( + Ar LE} = p {E (t + A) | 6 (9 = 0, Ex} to (t) + 
+ p {E(é + Ai) 18 (8 = 1, Er} su (0), 


la condition 6 (4) = 1 signifiant en fait que 6 (s) = 1 pour tous les 
s>t; la formule générale (4.3.13) nous donne 


piEe(tHAt)10(t)—=1, Eh _A : 
PiEGU A1) [0 ()—0, E} = exp { AE (1) D «A o (At)), 


et l'égalité (4.3.15) permet d'établir que 
P {0(1)==0|Errar} = P {0(4) =0IE, E(+At)} = 
1 

= 70 (6) tt 
 20+m@exp {a5@— À} (4+otar) 
= to () À FR 1 — 

4 (e) (AE (+ AE (D?) +0 (an 

— no (8) {1m (9 (AE (D — 5 + AE () + 

+ [mi (AEE—S +5 AE (D) F+o(an}= 
= 100 (8) {1 (6) (AE (D — D +5 AE (EE) + mu (HAE (2 + o(A}, 


où o (At) désigne maintenant un infiniment petit d’ordre plus élevé 
que At + AE (t)°. 
Enfin en utilisant la formule 


P{0(4+ At) =0]E4ae} = P {8 (+ At) —018 (4) — 
= 0, Et+at} P {6 (t) — 0 | Ettat} 


et des relations obtenues ci-dessus on obtient pour x (£) — x, (t) = 


su (£+ At) = (1 — AE) x (8) [1 — (1 — 2 (2) (AE (9 — + 
+ TA (DE) + (4 — x (JPA (07 ] 0 (A0) = x (9) — 
—n (4) LAAE + (4 — x (6) [AE (0) — At] — 
— (4 — 7 (PAS (0 } + x (8) (1 — 2 (0) ) AE (8) +0 (A). 


PROBLÈMES DE PRONOSTIC, DE FILTRAGE ET DE RÉGULATION (CH. IV 


[A 
=] 
[A 


Si l’on néglige ici la grandeur o (Af) d'ordre plus élevé que 
At + AE (t)° ainsi que le terme + (A — x (t)) [AE (4) — At) conte- 
nant la grandeur AE (ft)? — At pour laquelle 

| M {AE (t)° — At | Es} = o (Ab) 


M {IAE (#2 — At [E} = o (AD) 
(comparer avec les conditions (3.8.13), (3.8.14)), on obtient 
An (= —n() (À — (1 — x (4°) At + x (8) (1 — x (4) AË (0). 
En considérant le cas de £{ continu on peut montrer que x (é) = 
— P {0() = 0 |EË:}, en tant que fonction du processus aléatoire 


E(s), st, varie dans le temps d’une manière continue de sorte 
qu'il existe la différentielle stochastique 


du) =—n (A — ( — x (7) dé + n (4) (1 — x (1) de (), 


où la différentielle stochastique dE (t) est définie par la formule 
(4.3.12). 


et 


INDEX ALPHABÉTIQUE DES MATIÈRES 


Additivité 17 

— dénombrable 18 

Approximation 

— de Poisson de la distribution bino- 
miale 914 

— d’une variable, la meilleure 244 

Axiome des probabilités totales 17 


Bruit blanc 222 


Chaîne de Markov 134 

Classe fermée d'états 146 

Coefficient 

— de corrélation 55 

— de diffusion 96 

— d’ergodicité 147, 160 

Composition des densités de probabi- 
lité 38 

Condition 

— de Liapounov 108, 127 

— de Lipchitz 232 

Continuité des probabilités 16 

Contrôle sélectif de la production 75 

Convergence 

— des lois de probabilité 120 

— en moyenne quadratique 58, 216 

— en probabilité 57 

Convolution des densités de proba- 

bilité 38 


Dégénérescence d’un processus à ra- 
mifications 169 

Densité de probabilité 9, 33 

— — conditionnelle 39 

— — dela distribution simultanée 33 
— — de sortie d’un état 137, 155 
— Spectrale d’un processus aléatoire 
— étructurale d’un processus aléatoire 


— — de transition 133, 155 


Dérivée en moyenne quadratique 218 
Différence des événements 15 
Différentielle stochastique 231 
Distance quadratique moyenne 53 
Distribution des probabilités (voir 
également Lois de probabilité) 
de Bernoulli 77 
binomiale 77, 89 
compacte 122 
conditionnelle 38 
continue 31 
de dimension finie 129 
discrète 30 
exponentielle 84 
gamma 88, 111 
gaussienne 103, 193 
— type 103 
géométrique 84 
ypergéométrique 75 
de Maxwell 111 
normale 103 
— doublée 100 
de Poisson (poissonnienne) 76, 79 
de Rayleigh 111 
simultanée 33 
stationnaire 146 
de Student 118 
du t 118 
triangulaire 38, 118 
du y° 111 


Ecart type 103 
Echantillon 58 
Echantillonnage 68 

Effet 

— de dégénérescence 169 
— d’explosion 169 

— de grenaille 201 

Egalité de Parseval 124 
Epreuves de Bernoulli 89 
Equation (s) 

— de Kolmogorov 155, 240 
— de Kolmogorov-Chapman 236 


274 


Espace 

— des événements élémentaires 13 

— linéaire 244 

Espérance mathématique 42 

— — conditionnelle 49, 262 

— — répétée 52 

— — totale 51 

Estimations 

— linéaires centrées 255 

— — —, les meilleures 257 

— des moindres carrés 255 

Etat(s) 

— absorbant 137 

— communicants 145 

— non récurrent 138 

— positif 145 

— réalisable 145 

— récurrent 138 

Evénement(s) 

— complémentaire 15 

— disjoints 15 

— élémentaire 8, 13 

— impossible 14 

— incompatibles 15 

— indépendants (mutuellement) 26 

— simple 8 

Expérience(s) 

— indépendantes 22 

— à un nombre fini 
équiprobables 8 


de résultats 


Flux d'événements 

— — homogène 79 

— — poissonnien 132 

— de demandes poissonnien 156 
Fonction(s) 

caractéristique 114 

de corrélation 129 

— d’un processus stationnaire 206 
gamma eulérienne 88 
énératrices 139 

e pondération 199 

de répartition 31 

de transfert 214 


Hyperplan 244 


Identité 

— de Plancherel 125 

— de Wald 188 

Indépendance 

— des expériences 22 

— des variables aléatoires 41 


INDEX ALPHARÉTIQUE DES MATIÊÉRES 


Inégalité 

— de Cauchy-Bouniakovski 47 
— de Tchébychev 47 

— triangulaire 60 

Instant(s) 

— markovien 134 

— de renouvellement 170 
[Intégrale 

— de Fourier 115 

— de probabilité 102 

— stochastique 195, 197, 226 
Intersection des événements 14 


Jeu 

— de dé 7 

— jusqu’à la première perte 19 
— de roulette 7 


Lancement d'une pièce de monnaie 7, 

Lemme 

— de Borel-Cantelli 59 

— de la perpendiculaire 244 

Limite en moyenne quadratique 57 
oi 

— de l'arc sinus 102 

— de distribution conjointe 41 

— des grands nombres 64 

forte 64 

— de probabilité (voir également 
Distribution des probabilités) 

— — binomiale 119 

- de Cauchy 117 

exponentielle symétrique 117 

normale 116 

— doublée 100 

de Poisson 116 

triangulaire 38, 118 

uniforme 116 

du #? 119 


Matrice de corrélation 56, 104 

définie positive 56, 105 

Moment d'une variable aléatoire 47, 
116 


Mouvement 

— brownien 95, 132, 224 
— errant 131, 141, 152 
— pendulaire perturbé 222 
Moyenne 42, 129 

— conditionnelle 49 

— empirique 47 

— quadratique 109 


INDEX ALPHABÉTIAUE DES MATIÈRES 


Nombre 

— d'arrangements 69 
— de combinaisons 69 
— de permutations 69 


Période d'indisponibilité 187 

Perpendiculaire à un espace 224 

Planche de Galton 97 

Probabilité 

conditionnelle 26, 52 

d’explosion 170 

limite 175 

de naissance d’un garçon 21 

a posteriori 269 

de retour 138 

totale 52 

de transition 133, 135 

roblème 

de l’aiguille de Buffon 11 

des déréglages spontanés 268 

de la distribution des particules 72 

d’un groupe d'appareils 246 

du joueur ruiné 28 

Processus aléatoire 

— 3 à accroissements indépendants 
3 


III 


— — à accroissements non corrélés 
194 


— — — à accroissements indépen- 
dants 201 

— — — à accroissements non cor- 
rélés 199 

— markovien 130 

— branchu 163 

— de diffusion 224 

— homogène 133 

de Poisson 132 

— complexe 202 

rigoureusement markovien 134 

stationnaire (au sens large) 200 

— à spectre continu 207 

— à spectre discret 206 

de désintégration radioactive 83 

de renouvellement 170 

— de reproduction 158 

Produit des événements 14 

Projection sur l’hyperplan 244 


Réalisation d'un processus aléatoire 
130 


275 


“Répartition simultanée des probabi- 


lités 32 
Réunion des événements 14 


Somme des événements 14 

Spectre de fréquence d’un processus 
aléatoire 207 

Stabilité de la loi de Cauchy 120 

Suite de variables aléatoires 58 

Système(s) 

— d'attente 157, 161 

— — à un canal 183 

Ts à temps de service exponentiel 


0 
— d'équations différentielles de Kol- 
mogorov, direct 155 

— — — —, inverse 155 

— d'événements complet 28 

— — décomposable 20 
— linéaires 191 
— — stables 199 


Temps d'attente 86 

Théorème 

— ergodique 146 

— de la limite centrée 108 
— de Moivre-Laplace 92, 108 
Tirage 

— avec remise 68, 76 

— exhaustif 69 

— sans remise 69 

Trajectoire d'un processus aléatoire 
Transformation 

— de Fourier 211 

— — inverse 115 

— de Laplace 214 


Valeur moyenne 42, 103 

— — conditionnelle 49 

— — empirique 109 

— — d’un processus aléatoire 129 
quadratique 47 

Variable(s) aléatoire(s) 9 

— continue 30 

— discontinue 30 

— gaussiennes 105 

indicatrice d’un événement 52 
indépendantes 35, 38, 43 
multidimensionnelles 40 
non corrélées 194 

normales 105 
uniformément distribuée 9 


A NOS LECTEURS 


Les Editions Mir vous seraient très reconnais- 
santes de bien vouloir leur communiquer votre opi- 
nion sur le contenu de ce livre, sa traduction et 
présentation, ainsi que toute autre suggestion. 


Ecrire à l'adresse: 4° Rijski péréoulok, 2, 
Moscou, 1-278, U.R.SSS. 


Imprimé en Union Soviétique 


DANS LA MÊME COLLECTION 


/ 
ÉLÉMENTS DE MÉCANIQUE RATIONNELLE 


par S. Targ 


Ce cours dû au professeur Sémion Targ, docteur ès sciences physiques et 
mathématiques, s'adresse aux élèves des écoles techniques supérieures mais 
il peut aussi bien servir de manuel pour tous ceux qui entreprennent l'étude 
autodidactique de la mécanique rationnelle. 

On y énonce les fondements de la mécanique rationnelle: lois générales 
du mouvement, de l'équilibre et des interactions entre les corps matériels. 

À côté de ces notions générales le cours contient des développements sur 
des questions de mécanique appliquée qui sont aujourd’hui d'actualité: loi 
du mouvement dans le champ de la pesanteur (satellites artificiels et trajectoires 
elliptiques); mouvement des corps à masse variable (propulsion des fusées), 
théorie simplifiée du gyroscope, etc. 

11 a été accordé une large place aux exemples et aux méthodes de résolu- 
tion de problèmes qui contribuent certainement à une meilleure compréhension 
de la nature même des phénomènes mécaniques. 

C'est la seconde édition revisée en français. Quatre éditions en langue 
russe de ce livre ont été épuisées. 


